Domain 1 · 11 phút đọc

Các loại Machine Learning

Types of Machine Learning

Ở bài trước ta đã điểm qua ba nhánh ML. Bài này đi sâu vào từng loại: học có giám sát Supervised Learning, học không giám sát Unsupervised Learninghọc tăng cường Reinforcement Learning — kèm các bài toán con, ví dụ thực tế và dịch vụ AWS nên dùng.

1. Supervised Learning (học có giám sát)

Mô hình học từ dữ liệu đã gán nhãn (labeled data): mỗi mẫu đầu vào đi kèm một "đáp án đúng" (label/target). Mục tiêu là học một hàm ánh xạ từ input sang output để sau này dự đoán nhãn cho dữ liệu mới.

Supervised learning chia làm hai bài toán con quan trọng:

  • Classification (phân loại) — đầu ra là nhãn rời rạc (categorical). Ví dụ: email là spam / không spam; ảnh là chó / mèo / chim; khoản vay được duyệt / từ chối.
    • Binary classification: hai lớp (spam vs not spam).
    • Multiclass classification: nhiều hơn hai lớp (phân loại loài hoa).
  • Regression (hồi quy) — đầu ra là giá trị số liên tục (numeric). Ví dụ: dự đoán giá nhà, dự báo doanh thu, ước lượng nhiệt độ ngày mai.

Trọng tâm thi

Mẹo phân biệt nhanh: nếu câu hỏi yêu cầu chọn nhãn/lớp → classification; nếu yêu cầu dự đoán một con số → regression. Cả hai đều thuộc supervised vì cần dữ liệu đã gán nhãn.

2. Unsupervised Learning (học không giám sát)

Mô hình làm việc với dữ liệu chưa gán nhãn (unlabeled data) và tự tìm cấu trúc ẩn. Không có "đáp án đúng" để học theo. Ba bài toán con thường gặp:

  • Clustering (phân cụm) — nhóm các điểm dữ liệu giống nhau lại với nhau. Ví dụ: phân khúc khách hàng (customer segmentation) theo hành vi mua sắm.
  • Dimensionality reduction (giảm chiều dữ liệu) — nén số lượng đặc trưng (features) mà vẫn giữ thông tin quan trọng. Ví dụ: PCA Principal Component Analysis giúp trực quan hóa và tăng tốc huấn luyện.
  • Anomaly detection (phát hiện bất thường) — tìm các điểm dữ liệu khác lạ so với phần còn lại. Ví dụ: phát hiện giao dịch gian lận, lỗi cảm biến, hành vi đăng nhập bất thường.

Mẹo

Điểm khác biệt cốt lõi: supervised có nhãn để học, unsupervised không có nhãn mà tự khám phá cấu trúc. Customer segmentation là ví dụ kinh điển của clustering (unsupervised).

3. Reinforcement Learning (học tăng cường)

Một tác tử agent học bằng cách tương tác với môi trường: thực hiện hành động (action), nhận về phần thưởng (reward) hoặc hình phạt, rồi điều chỉnh chiến lược (policy) để tối đa hóa phần thưởng tích lũy theo thời gian. Mô hình học qua thử–sai (trial and error), không cần tập dữ liệu gán nhãn sẵn.

Ví dụ điển hình:

  • Robot học cách đi lại.
  • AI chơi game (cờ vây, game Atari).
  • Điều khiển hệ thống, tối ưu danh mục, định tuyến.

So sánh nhanh

Supervised học từ đáp án có sẵn; unsupervised tự tìm cấu trúc; reinforcement học từ phần thưởng qua tương tác. Đây là phân biệt rất hay bị hỏi trong đề thi.

Bảng tổng hợp ba loại học

Tiêu chíSupervisedUnsupervisedReinforcement
Dữ liệuĐã gán nhãnChưa gán nhãnKhông cần tập có sẵn
Mục tiêuDự đoán nhãn/giá trịTìm cấu trúc ẩnTối đa hóa reward
Bài toán conClassification, RegressionClustering, Dimensionality reduction, Anomaly detectionPolicy/chiến lược tối ưu
Ví dụLọc spam, dự đoán giá nhàPhân khúc khách hàngRobot, chơi game

Loại học và dịch vụ AWS phù hợp

Bạn không cần huấn luyện mọi thứ từ đầu. AWS có dịch vụ phù hợp với từng loại bài toán:

Bài toánLoại họcDịch vụ AWS gợi ý
Phân loại / hồi quy tùy biếnSupervisedAmazon SageMaker AI (tự xây mô hình)
Dự báo nhu cầu theo thời gianSupervised (chuỗi thời gian)Amazon SageMaker (built-in algorithms)
Gợi ý sản phẩmHỗn hợpAmazon Personalize
Phát hiện gian lậnSupervised / anomalyAmazon Fraud Detector
Phân khúc / khám phá dữ liệuUnsupervisedAmazon SageMaker (K-Means, PCA built-in)

Trọng tâm thi

Khi đề mô tả "dữ liệu đã gán nhãn để dự đoán" → supervised. Khi đề nói "nhóm khách hàng tương tự nhau mà không có nhãn" → unsupervised (clustering). Khi đề nhắc "phần thưởng / thử–sai / agent trong môi trường" → reinforcement.

Tóm tắt

  • Supervised: dữ liệu đã gán nhãn → Classification (nhãn rời rạc) và Regression (giá trị số).
  • Unsupervised: dữ liệu chưa gán nhãn → Clustering, Dimensionality reduction, Anomaly detection.
  • Reinforcement: agent học qua thử–sai và phần thưởng trong môi trường.
  • Ghi nhớ tín hiệu nhận diện: có nhãn → supervised; không nhãn → unsupervised; reward → reinforcement.
  • SageMaker AI cho mô hình tùy biến; Personalize, Fraud Detector... cho các bài toán đóng gói sẵn.