Domain 1 · 12 phút đọc

Hệ sinh thái dịch vụ AI/ML của AWS

The AWS AI/ML Service Stack

AWS cung cấp một "ngăn xếp" (stack) dịch vụ AI/ML theo nhiều mức trừu tượng. Hiểu khi nào dùng dịch vụ nào là một trong những phần được hỏi nhiều nhất trong AIF-C01.

Hai tầng chính của ngăn xếp

  1. ML platform — Amazon SageMaker AI: dành cho người muốn tự xây dựng, huấn luyện và triển khai mô hình ML. Bạn kiểm soát dữ liệu, thuật toán, siêu tham số. Phù hợp khi bài toán tùy biến, không có dịch vụ đóng gói sẵn đáp ứng.
  2. Pre-built AI services (dịch vụ AI dựng sẵn): các API thông minh dùng ngay, không cần kiến thức ML hay huấn luyện mô hình. Bạn chỉ gọi API và nhận kết quả. Phù hợp khi bài toán phổ biến (nhận diện ảnh, chuyển giọng nói thành văn bản...).

Trọng tâm thi

Quy tắc vàng: cần tùy biến / tự huấn luyện mô hìnhSageMaker AI. Cần một năng lực AI thông dụng, dùng ngay không cần kỹ năng ML → một pre-built AI service.

Amazon SageMaker AI

SageMaker AI Amazon SageMaker AI là nền tảng ML được quản lý toàn phần (fully managed) phục vụ toàn bộ vòng đời ML:

  • Chuẩn bị dữ liệu (Data Wrangler), gắn nhãn (Ground Truth).
  • Huấn luyện với thuật toán built-in hoặc framework tùy chọn.
  • Tinh chỉnh siêu tham số (hyperparameter tuning).
  • Triển khai endpoint thời gian thực hoặc batch.
  • Giám sát mô hình (Model Monitor).

Dùng SageMaker khi bạn cần kiểm soát và tùy biến mô hình cho bài toán riêng.

Các dịch vụ AI dựng sẵn

Mỗi dịch vụ giải quyết một loại tác vụ AI cụ thể. Hãy nhớ ánh xạ năng lực ↔ dịch vụ:

Dịch vụNăng lựcVí dụ dùng
Amazon RekognitionPhân tích ảnh & video (computer vision)Nhận diện vật thể, khuôn mặt, nội dung không an toàn
Amazon ComprehendXử lý ngôn ngữ tự nhiên (NLP)Phân tích cảm xúc, trích thực thể, phân loại văn bản
Amazon TextractTrích xuất văn bản & dữ liệu từ tài liệuĐọc hóa đơn, biểu mẫu, bảng (kể cả ảnh scan)
Amazon PollyChuyển văn bản thành giọng nói (TTS)Đọc bài viết, tạo voice cho ứng dụng
Amazon TranscribeChuyển giọng nói thành văn bản (STT)Tạo phụ đề, ghi biên bản cuộc gọi
Amazon TranslateDịch máy giữa các ngôn ngữBản địa hóa nội dung, dịch theo thời gian thực
Amazon LexXây chatbot & trợ lý giọng nói (conversational AI)Bot hỗ trợ khách hàng (cùng engine với Alexa)
Amazon PersonalizeGợi ý cá nhân hóa (recommendations)Gợi ý sản phẩm, nội dung
Amazon ForecastDự báo chuỗi thời gian (time-series)Dự báo nhu cầu, tồn kho, doanh thu
Amazon KendraTìm kiếm thông minh (intelligent search)Tìm kiếm theo ngữ nghĩa trong tài liệu nội bộ
Amazon Fraud DetectorPhát hiện gian lận trực tuyếnPhát hiện tài khoản giả, giao dịch gian lận
Amazon Comprehend MedicalNLP cho dữ liệu y tếTrích thông tin lâm sàng từ hồ sơ bệnh án

Cách nhớ theo cặp đối lập

Polly = văn bản → giọng nói; Transcribe = giọng nói → văn bản. Đừng nhầm chiều. Textract ≠ Rekognition: Textract chuyên trích chữ/dữ liệu từ tài liệu, Rekognition chuyên hiểu nội dung ảnh/video.

Chọn dịch vụ theo tình huống

  • "Đọc dữ liệu từ hóa đơn / biểu mẫu PDF có bảng" → Textract.
  • "Phân tích cảm xúc bình luận khách hàng" → Comprehend.
  • "Tạo phụ đề tự động cho video" → Transcribe.
  • "Đọc thành tiếng nội dung bài báo" → Polly.
  • "Chatbot hỗ trợ khách hàng" → Lex.
  • "Gợi ý phim cho từng người dùng" → Personalize.
  • "Dự báo nhu cầu kho theo mùa" → Forecast.
  • "Tìm kiếm theo ngữ nghĩa trong kho tài liệu công ty" → Kendra.
  • "Mô hình phân loại tùy biến trên dữ liệu riêng" → SageMaker AI.

Tránh nhầm phổ biến

Nếu đề nói "không có kỹ năng ML, muốn dùng ngay" mà bạn chọn SageMaker thì thường sai — SageMaker đòi hỏi tự xây mô hình. Ngược lại, nếu bài toán quá đặc thù và không dịch vụ dựng sẵn nào khớp, thì SageMaker mới là câu trả lời.

Tóm tắt

  • Ngăn xếp AWS có hai tầng: SageMaker AI (tự xây mô hình) và các dịch vụ AI dựng sẵn (API dùng ngay).
  • Vision → Rekognition; NLP → Comprehend; trích tài liệu → Textract.
  • TTS → Polly; STT → Transcribe; dịch → Translate; chatbot → Lex.
  • Recommendations → Personalize; time-series → Forecast; tìm kiếm thông minh → Kendra.
  • Gian lận → Fraud Detector; NLP y tế → Comprehend Medical.
  • Quy tắc chọn: cần tùy biến/tự huấn luyện → SageMaker; cần năng lực phổ biến dùng ngay → dịch vụ dựng sẵn.