Domain 2 · 10 phút đọc

Khả năng, lợi ích và giới hạn của Generative AI

Generative AI Capabilities, Benefits, and Limitations

Sau khi hiểu generative AI là gì, bạn cần nắm nó làm được gì, mang lại lợi ích nào, và quan trọng không kém — giới hạn và rủi ro của nó. Kỳ thi AIF-C01 thường hỏi dạng "chọn use case phù hợp" hoặc "đâu là hạn chế của GenAI".

Khả năng và use case phổ biến

Khả năngMô tảVí dụ thực tế
Sinh văn bản Text generationViết nội dung mớiSoạn email, mô tả sản phẩm, blog
Tóm tắt SummarizationRút gọn văn bản dàiTóm tắt báo cáo, biên bản họp
Hỏi đáp / Chatbot Question answering / ChatbotsTrả lời câu hỏi, hội thoạiTrợ lý CSKH, hỗ trợ nội bộ
Sinh mã Code generationViết / giải thích codeGợi ý code, viết unit test
Dịch thuật TranslationDịch giữa các ngôn ngữDịch tài liệu đa ngôn ngữ
Sinh ảnh Image generationTạo ảnh từ mô tảẢnh marketing, concept art
Sinh âm thanh / video Audio/Video generationTạo giọng nói, nhạc, videoLồng tiếng, tạo clip ngắn
Tìm kiếm ngữ nghĩa Semantic searchTìm theo ý nghĩa, không chỉ từ khóaTìm tài liệu liên quan

Mẹo

Khi đề cho một tình huống cụ thể, hãy ánh xạ sang một trong các khả năng ở bảng trên. Ví dụ "tự động trả lời câu hỏi khách hàng" → chatbot/Q&A; "rút gọn 100 trang hợp đồng" → summarization.

Lợi ích của Generative AI

  • Tốc độ (speed): tạo bản nháp trong vài giây thay vì hàng giờ.
  • Quy mô (scale): phục vụ hàng nghìn yêu cầu đồng thời, cá nhân hóa nội dung hàng loạt.
  • Sáng tạo (creativity): gợi ý nhiều phương án, vượt qua "trang giấy trắng".
  • Giảm rào cản: người không chuyên cũng viết code, soạn nội dung được nhờ ngôn ngữ tự nhiên.
  • Tận dụng FM có sẵn: không cần dữ liệu/huấn luyện riêng cho mỗi bài toán.

Giới hạn và rủi ro (rất hay thi)

Hallucination (bịa thông tin)

Hallucination Hallucination là khi mô hình tạo ra thông tin nghe hợp lý nhưng sai sự thật. Vì LLM dự đoán token có khả năng cao chứ không tra cứu sự thật, nó có thể "bịa" tên, số liệu, trích dẫn. Luôn cần con người kiểm chứng ở các tác vụ quan trọng.

Nondeterminism (kết quả không cố định)

Với cùng một prompt, mô hình có thể cho đầu ra khác nhau giữa các lần chạy (tính không xác định nondeterminism). Điều này khác hẳn phần mềm truyền thống. Có thể giảm bằng cách hạ temperature temperature (xem bài sau).

Knowledge cutoff (giới hạn kiến thức theo thời điểm)

Mô hình chỉ "biết" tới thời điểm dữ liệu huấn luyện được thu thập (mốc kiến thức knowledge cutoff). Nó không biết sự kiện mới sau mốc đó và không truy cập dữ liệu riêng của bạn trừ khi bạn cung cấp thêm (ví dụ qua RAG).

Bias (thiên lệch)

Mô hình học từ dữ liệu thực tế nên có thể kế thừa thiên lệch (giới tính, chủng tộc...), dẫn tới đầu ra không công bằng. Đây là vấn đề Responsible AI quan trọng.

Chi phí và độ trễ (cost & latency)

FM lớn tốn chi phí tính theo token và có thể chậm với prompt dài. Cần cân nhắc bài toán có thực sự cần GenAI hay không.

Thiếu khả năng giải thích (explainability)

LLM là "hộp đen" — khó giải thích vì sao nó đưa ra một câu trả lời cụ thể.

Lưu ý

Đừng dùng GenAI cho quyết định cần chính xác tuyệt đối hoặc có thể kiểm toán pháp lý mà không có người kiểm chứng. Hallucination và nondeterminism khiến nó không phù hợp làm "nguồn sự thật" duy nhất.

Khi nào Generative AI KHÔNG phải lựa chọn đúng?

  • Phép tính chính xác / quy tắc xác định: tính thuế theo công thức cố định → dùng code.
  • Cần kết quả nhất quán 100%: tra cứu giá theo bảng → dùng database, không dùng LLM.
  • Bài toán phân loại đơn giản, dữ liệu có nhãn dồi dào: ML truyền thống thường rẻ và chính xác hơn.
  • Dữ liệu rất nhỏ và quy tắc rõ ràng: viết logic thông thường là đủ.

Trọng tâm thi

Câu hỏi "hạn chế của GenAI" thường có đáp án đúng là hallucination, bias, nondeterminism, hoặc knowledge cutoff. Câu hỏi "có nên dùng GenAI không" → nếu cần chính xác xác định thì câu trả lời thường là không.

Tóm tắt

  • Use case chính: sinh văn bản, tóm tắt, Q&A/chatbot, sinh code, dịch, sinh ảnh/âm thanh/ video, tìm kiếm ngữ nghĩa.
  • Lợi ích: tốc độ, quy mô, sáng tạo, giảm rào cản.
  • Rủi ro/giới hạn cần nhớ: hallucination, nondeterminism, knowledge cutoff, bias, chi phí, thiếu explainability.
  • GenAI không phù hợp khi cần độ chính xác xác định, kết quả nhất quán tuyệt đối, hoặc khi ML truyền thống / code thường rẻ và đúng hơn.