Các dịch vụ Generative AI của AWS
AWS Generative AI Services
AWS cung cấp một bộ dịch vụ để xây dựng và sử dụng generative AI mà không cần tự huấn luyện foundation model. Bạn phải biết dịch vụ nào dùng cho nhu cầu nào — đây là dạng câu hỏi "chọn dịch vụ phù hợp" rất phổ biến trong AIF-C01.
Amazon Bedrock — nền tảng cốt lõi
Amazon Bedrock Amazon Bedrock là dịch vụ quản lý toàn phần (fully managed), serverless, cung cấp nhiều foundation model qua một API thống nhất. FM đến từ Amazon (dòng Amazon Titan, Amazon Nova) và các nhà cung cấp bên thứ ba (ví dụ Anthropic, Meta, Mistral, Stability AI, Cohere, AI21).
Đặc điểm chính:
- Một API, nhiều mô hình: dễ dàng thử và đổi giữa các FM mà không phải viết lại nhiều.
- Không quản lý hạ tầng: không lo GPU, scaling — đúng tinh thần serverless.
- Tùy biến: hỗ trợ fine-tuning và continued pretraining trên dữ liệu của bạn.
- Knowledge Bases for Bedrock: dựng RAG để mô hình trả lời dựa trên dữ liệu riêng.
- Agents for Bedrock: cho mô hình gọi API / thực hiện hành động nhiều bước.
- Guardrails for Bedrock: lọc nội dung độc hại, chặn chủ đề nhạy cảm — phục vụ Responsible AI.
- Dữ liệu của bạn không được dùng để huấn luyện FM gốc — yếu tố bảo mật quan trọng.
Trọng tâm thi
Khi đề nói "truy cập nhiều FM qua một API", "xây ứng dụng GenAI serverless", "không muốn quản lý hạ tầng mô hình" → đáp án gần như chắc chắn là Amazon Bedrock.
Amazon Q — trợ lý GenAI dùng ngay
Amazon Q Amazon Q là trợ lý generative AI được đóng gói sẵn để dùng ngay, có hai dòng chính:
- Amazon Q Business Amazon Q Business: trợ lý cho doanh nghiệp/nhân viên. Kết nối các nguồn dữ liệu nội bộ (S3, SharePoint, Salesforce...) để trả lời câu hỏi, tóm tắt, sinh nội dung dựa trên kiến thức công ty.
- Amazon Q Developer Amazon Q Developer: trợ lý cho lập trình viên — gợi ý code, giải thích code, hỗ trợ debug và các tác vụ phát triển/vận hành trên AWS.
Ghi chú
Khác biệt then chốt: Bedrock dành cho xây dựng ứng dụng tùy chỉnh (bạn là nhà phát triển dùng API), còn Amazon Q là ứng dụng trợ lý dùng ngay (ít hoặc không cần code).
Amazon SageMaker JumpStart
SageMaker JumpStart Amazon SageMaker JumpStart là trung tâm (hub) mô hình học máy trong SageMaker. Nó cung cấp các FM và mô hình dựng sẵn cùng mẫu giải pháp, cho phép bạn triển khai và fine-tune mô hình với nhiều quyền kiểm soát hơn. Phù hợp khi bạn cần làm việc sâu trong môi trường ML (SageMaker) và muốn kiểm soát quá trình tùy biến/triển khai.
PartyRock
PartyRock PartyRock là sân chơi (playground) dựa trên Amazon Bedrock, cho phép xây app GenAI nhỏ bằng cách kéo-thả, không cần viết code. Nó hướng tới học tập và thử nghiệm nhanh, không phải để chạy production quy mô lớn.
So sánh nhanh: dùng dịch vụ nào?
| Nhu cầu | Dịch vụ phù hợp |
|---|---|
| Truy cập nhiều FM qua một API, xây app tùy chỉnh serverless | Amazon Bedrock |
| Trợ lý hỏi đáp trên tài liệu nội bộ cho nhân viên | Amazon Q Business |
| Trợ lý hỗ trợ lập trình viên (code, debug) | Amazon Q Developer |
| Triển khai/fine-tune FM với kiểm soát trong môi trường ML | SageMaker JumpStart |
| Học và prototype app GenAI không cần code | PartyRock |
Khái niệm giá (pricing)
Bạn không cần nhớ con số, nhưng cần nắm mô hình tính giá:
- Tính giá theo token Token-based pricing: với Bedrock, chi phí thường dựa trên số token đầu vào + đầu ra. Prompt/đầu ra càng dài → càng tốn.
- On-demand On-demand: trả theo lượng dùng, không cam kết trước — hợp cho tải biến động hoặc thử nghiệm.
- Provisioned throughput Provisioned throughput: đặt trước năng lực (mua capacity theo thời hạn) để đảm bảo throughput ổn định — hợp cho tải lớn, ổn định, dự đoán được, và có thể tiết kiệm hơn ở quy mô.
Trọng tâm thi
On-demand = linh hoạt, trả theo dùng, tải biến động. Provisioned throughput = cam kết năng lực trước, cho tải ổn định/khối lượng lớn. Đừng nhầm hai chế độ này.
Tóm tắt
- Amazon Bedrock: API thống nhất tới nhiều FM, serverless, hỗ trợ fine-tuning, RAG (Knowledge Bases), Agents, Guardrails — dùng để xây ứng dụng GenAI tùy chỉnh.
- Amazon Q Business (trợ lý doanh nghiệp trên dữ liệu nội bộ) và Amazon Q Developer (trợ lý cho lập trình viên) — dùng ngay.
- SageMaker JumpStart: hub mô hình để triển khai/fine-tune với kiểm soát sâu hơn.
- PartyRock: sân chơi học tập, build app GenAI không cần code.
- Giá: theo token; on-demand cho tải biến động, provisioned throughput cho tải ổn định, khối lượng lớn.