Công cụ AWS cho Responsible AI
AWS Tools for Responsible AI
Đây là bài được hỏi nhiều nhất trong Domain 4. Câu hỏi thường mô tả một nhu cầu (phát hiện bias, giải thích dự đoán, phát hiện drift, lọc nội dung, đưa con người vào duyệt...) và yêu cầu bạn chọn đúng dịch vụ. Hãy nắm chắc mỗi công cụ giải quyết vấn đề gì.
Amazon SageMaker Clarify
SageMaker Clarify SageMaker Clarify là công cụ chủ lực cho fairness và explainability trong vòng đời ML:
- Phát hiện bias trước huấn luyện (pre-training): kiểm tra mất cân bằng/thiên kiến ngay trong dữ liệu (ví dụ một nhóm bị thiếu đại diện).
- Phát hiện bias sau huấn luyện (post-training): kiểm tra xem dự đoán của mô hình có thiên kiến theo nhóm hay không.
- Explainability / feature attribution: dùng giá trị kiểu SHAP để cho biết đặc trưng nào ảnh hưởng nhiều nhất tới dự đoán.
Trọng tâm thi
Khi đề nói "phát hiện bias và giải thích mức độ quan trọng của đặc trưng" → gần như chắc chắn là SageMaker Clarify.
Amazon SageMaker Model Monitor
SageMaker Model Monitor SageMaker Model Monitor giám sát mô hình đã triển khai trong môi trường sản xuất và phát hiện trôi mô hình model drift — khi dữ liệu thực tế dần đi chệch khỏi dữ liệu huấn luyện, làm chất lượng dự đoán suy giảm theo thời gian. Nó theo dõi data quality, model quality, bias drift và feature attribution drift, rồi cảnh báo để bạn huấn luyện lại.
Amazon SageMaker Model Cards
SageMaker Model Cards SageMaker Model Cards là tài liệu đính kèm từng mô hình ghi lại: mục đích dự kiến, dữ liệu huấn luyện, chỉ số đánh giá, giới hạn và các cân nhắc đạo đức. Chúng phục vụ transparency và governance nội bộ — giúp kiểm toán và bàn giao.
AWS AI Service Cards
AWS AI Service Cards AI Service Cards là tài liệu minh bạch do AWS công bố cho các dịch vụ AI của AWS (ví dụ Rekognition, Textract...). Mỗi card mô tả trường hợp dùng dự kiến, giới hạn, lựa chọn thiết kế có trách nhiệm và cách dùng dịch vụ một cách hợp lý.
Ghi chú
Đừng nhầm: Model Cards là tài liệu cho mô hình của bạn (trong SageMaker), còn AI Service Cards là tài liệu AWS công bố cho dịch vụ AI của AWS.
Amazon Bedrock Guardrails
Amazon Bedrock Guardrails Bedrock Guardrails áp rào chắn an toàn cho ứng dụng GenAI, độc lập với mô hình nền tảng được dùng:
- Content filters: lọc nội dung độc hại (thù ghét, bạo lực, tục tĩu, tấn công...).
- Denied topics: chặn các chủ đề bạn không muốn ứng dụng đề cập (ví dụ tư vấn tài chính).
- PII redaction: phát hiện và che/giấu thông tin cá nhân trong đầu vào hoặc đầu ra.
- Word filters và lọc theo từ khóa, cùng kiểm soát chống prompt injection ở mức cơ bản.
Guardrails phục vụ safety, privacy và veracity cho GenAI.
Amazon Augmented AI (Amazon A2I)
Amazon A2I Amazon Augmented AI giúp dễ dàng đưa con người vào quy trình duyệt (human-in-the-loop human-in-the-loop) cho các dự đoán ML — nhất là khi mô hình độ tin cậy thấp hoặc trong tình huống rủi ro cao. A2I tạo quy trình review để người duyệt xác nhận hoặc chỉnh sửa kết quả, phục vụ controllability và safety.
Bảng so sánh công cụ → mục đích
| Công cụ | Mục đích chính | Chiều responsible AI |
|---|---|---|
| SageMaker Clarify | Phát hiện bias (pre/post-training) + giải thích đặc trưng | Fairness, Explainability |
| SageMaker Model Monitor | Phát hiện drift của mô hình đã triển khai | Robustness, Veracity |
| SageMaker Model Cards | Tài liệu cho mô hình của bạn | Transparency, Governance |
| AWS AI Service Cards | Tài liệu AWS công bố cho dịch vụ AI | Transparency |
| Bedrock Guardrails | Lọc nội dung, chặn chủ đề, che PII | Safety, Privacy, Veracity |
| Amazon A2I | Đưa con người vào duyệt dự đoán | Controllability, Safety |
Mẹo
Mẹo ghép nhanh: bias + giải thích → Clarify; drift sau triển khai → Model Monitor; lọc nội dung/PII cho GenAI → Guardrails; con người duyệt → A2I; tài liệu mô hình của tôi → Model Cards; tài liệu AWS công bố → AI Service Cards.
Tóm tắt
- SageMaker Clarify: bias (trước/sau huấn luyện) + explainability (feature attribution).
- SageMaker Model Monitor: phát hiện drift trong sản xuất.
- Model Cards (mô hình của bạn) vs AI Service Cards (AWS công bố) — đều là transparency.
- Bedrock Guardrails: lọc nội dung độc hại, denied topics, che PII cho GenAI.
- Amazon A2I: human-in-the-loop để duyệt các dự đoán rủi ro cao.