Hệ sinh thái dịch vụ AI/ML của AWS
The AWS AI/ML Service Stack
AWS cung cấp một "ngăn xếp" (stack) dịch vụ AI/ML theo nhiều mức trừu tượng. Hiểu khi nào dùng dịch vụ nào là một trong những phần được hỏi nhiều nhất trong AIF-C01.
Hai tầng chính của ngăn xếp
- ML platform — Amazon SageMaker AI: dành cho người muốn tự xây dựng, huấn luyện và triển khai mô hình ML. Bạn kiểm soát dữ liệu, thuật toán, siêu tham số. Phù hợp khi bài toán tùy biến, không có dịch vụ đóng gói sẵn đáp ứng.
- Pre-built AI services (dịch vụ AI dựng sẵn): các API thông minh dùng ngay, không cần kiến thức ML hay huấn luyện mô hình. Bạn chỉ gọi API và nhận kết quả. Phù hợp khi bài toán phổ biến (nhận diện ảnh, chuyển giọng nói thành văn bản...).
Trọng tâm thi
Quy tắc vàng: cần tùy biến / tự huấn luyện mô hình → SageMaker AI. Cần một năng lực AI thông dụng, dùng ngay không cần kỹ năng ML → một pre-built AI service.
Amazon SageMaker AI
SageMaker AI Amazon SageMaker AI là nền tảng ML được quản lý toàn phần (fully managed) phục vụ toàn bộ vòng đời ML:
- Chuẩn bị dữ liệu (Data Wrangler), gắn nhãn (Ground Truth).
- Huấn luyện với thuật toán built-in hoặc framework tùy chọn.
- Tinh chỉnh siêu tham số (hyperparameter tuning).
- Triển khai endpoint thời gian thực hoặc batch.
- Giám sát mô hình (Model Monitor).
Dùng SageMaker khi bạn cần kiểm soát và tùy biến mô hình cho bài toán riêng.
Các dịch vụ AI dựng sẵn
Mỗi dịch vụ giải quyết một loại tác vụ AI cụ thể. Hãy nhớ ánh xạ năng lực ↔ dịch vụ:
| Dịch vụ | Năng lực | Ví dụ dùng |
|---|---|---|
| Amazon Rekognition | Phân tích ảnh & video (computer vision) | Nhận diện vật thể, khuôn mặt, nội dung không an toàn |
| Amazon Comprehend | Xử lý ngôn ngữ tự nhiên (NLP) | Phân tích cảm xúc, trích thực thể, phân loại văn bản |
| Amazon Textract | Trích xuất văn bản & dữ liệu từ tài liệu | Đọc hóa đơn, biểu mẫu, bảng (kể cả ảnh scan) |
| Amazon Polly | Chuyển văn bản thành giọng nói (TTS) | Đọc bài viết, tạo voice cho ứng dụng |
| Amazon Transcribe | Chuyển giọng nói thành văn bản (STT) | Tạo phụ đề, ghi biên bản cuộc gọi |
| Amazon Translate | Dịch máy giữa các ngôn ngữ | Bản địa hóa nội dung, dịch theo thời gian thực |
| Amazon Lex | Xây chatbot & trợ lý giọng nói (conversational AI) | Bot hỗ trợ khách hàng (cùng engine với Alexa) |
| Amazon Personalize | Gợi ý cá nhân hóa (recommendations) | Gợi ý sản phẩm, nội dung |
| Amazon Forecast | Dự báo chuỗi thời gian (time-series) | Dự báo nhu cầu, tồn kho, doanh thu |
| Amazon Kendra | Tìm kiếm thông minh (intelligent search) | Tìm kiếm theo ngữ nghĩa trong tài liệu nội bộ |
| Amazon Fraud Detector | Phát hiện gian lận trực tuyến | Phát hiện tài khoản giả, giao dịch gian lận |
| Amazon Comprehend Medical | NLP cho dữ liệu y tế | Trích thông tin lâm sàng từ hồ sơ bệnh án |
Cách nhớ theo cặp đối lập
Polly = văn bản → giọng nói; Transcribe = giọng nói → văn bản. Đừng nhầm chiều. Textract ≠ Rekognition: Textract chuyên trích chữ/dữ liệu từ tài liệu, Rekognition chuyên hiểu nội dung ảnh/video.
Chọn dịch vụ theo tình huống
- "Đọc dữ liệu từ hóa đơn / biểu mẫu PDF có bảng" → Textract.
- "Phân tích cảm xúc bình luận khách hàng" → Comprehend.
- "Tạo phụ đề tự động cho video" → Transcribe.
- "Đọc thành tiếng nội dung bài báo" → Polly.
- "Chatbot hỗ trợ khách hàng" → Lex.
- "Gợi ý phim cho từng người dùng" → Personalize.
- "Dự báo nhu cầu kho theo mùa" → Forecast.
- "Tìm kiếm theo ngữ nghĩa trong kho tài liệu công ty" → Kendra.
- "Mô hình phân loại tùy biến trên dữ liệu riêng" → SageMaker AI.
Tránh nhầm phổ biến
Nếu đề nói "không có kỹ năng ML, muốn dùng ngay" mà bạn chọn SageMaker thì thường sai — SageMaker đòi hỏi tự xây mô hình. Ngược lại, nếu bài toán quá đặc thù và không dịch vụ dựng sẵn nào khớp, thì SageMaker mới là câu trả lời.
Tóm tắt
- Ngăn xếp AWS có hai tầng: SageMaker AI (tự xây mô hình) và các dịch vụ AI dựng sẵn (API dùng ngay).
- Vision → Rekognition; NLP → Comprehend; trích tài liệu → Textract.
- TTS → Polly; STT → Transcribe; dịch → Translate; chatbot → Lex.
- Recommendations → Personalize; time-series → Forecast; tìm kiếm thông minh → Kendra.
- Gian lận → Fraud Detector; NLP y tế → Comprehend Medical.
- Quy tắc chọn: cần tùy biến/tự huấn luyện → SageMaker; cần năng lực phổ biến dùng ngay → dịch vụ dựng sẵn.