Dịch vụ lưu trữ: S3, EBS, EFS, FSx
Storage Services: S3, EBS, EFS, FSx
AWS có nhiều dịch vụ lưu trữ cho các nhu cầu khác nhau. Điều quan trọng nhất khi thi là phân biệt ba loại lưu trữ: object, block và file — rồi ánh xạ chúng tới đúng dịch vụ.
Ba loại lưu trữ
| Loại | Dữ liệu được tổ chức thế nào | Dịch vụ AWS chính | Ví dụ dùng |
|---|---|---|---|
| Object | Tệp + metadata, truy cập qua API/HTTP, không gắn vào một máy chủ | Amazon S3 | Ảnh, video, backup, data lake, hosting tĩnh |
| Block | Chia thành block, gắn (mount) vào một instance như ổ cứng | Amazon EBS | Ổ đĩa cho EC2, cơ sở dữ liệu |
| File | Hệ thống tệp phân cấp (thư mục), nhiều máy chủ truy cập cùng lúc | Amazon EFS, Amazon FSx | Chia sẻ file giữa nhiều EC2 |
Trọng tâm thi
Một câu hỏi phổ biến: "nhiều EC2 cần truy cập cùng một hệ thống tệp đồng thời" → Amazon EFS (file). "Ổ đĩa cho một instance, hiệu năng cao cho database" → EBS (block). "Lưu hàng triệu tệp/ảnh, truy cập qua web" → Amazon S3 (object).
Amazon S3
Amazon S3 Amazon Simple Storage Service là kho lưu trữ object với độ bền cực cao (99.999999999% — "11 số 9" durability). Dữ liệu lưu trong bucket. S3 có nhiều storage class storage class để tối ưu chi phí theo tần suất truy cập:
| Storage class | Phù hợp với |
|---|---|
| S3 Standard | Dữ liệu truy cập thường xuyên |
| S3 Standard-IA (Infrequent Access) | Ít truy cập nhưng cần lấy nhanh khi cần |
| S3 Intelligent-Tiering | Tự động chuyển tầng khi mẫu truy cập không đoán trước |
| S3 Glacier Instant Retrieval | Lưu trữ (archive) truy cập hiếm, lấy tức thì |
| S3 Glacier Flexible Retrieval / Deep Archive | Lưu trữ dài hạn, giá rẻ nhất, chấp nhận lấy chậm (phút–giờ) |
Mẹo
Dữ liệu archive lâu dài, hiếm truy cập, muốn rẻ nhất → S3 Glacier Deep Archive. Có thể dùng S3 Lifecycle S3 Lifecycle để tự động chuyển object sang tầng rẻ hơn theo thời gian.
Amazon EBS
Amazon EBS Amazon Elastic Block Store cung cấp volume block gắn vào instance EC2 — như một ổ cứng. Đặc điểm:
- Gắn vào một instance tại một thời điểm (trừ tính năng Multi-Attach đặc biệt).
- Tồn tại độc lập với vòng đời instance (dữ liệu không mất khi tắt instance).
- Có thể tạo snapshot sao lưu lên S3.
- EBS volume nằm trong một AZ.
Amazon EFS và Amazon FSx
- Amazon EFS Amazon Elastic File System: hệ thống tệp NFS cho Linux, tự co giãn, nhiều EC2 dùng chung đồng thời, trải trên nhiều AZ.
- Amazon FSx Amazon FSx: hệ thống tệp được quản lý cho các nền tảng cụ thể — ví dụ FSx for Windows File Server (SMB cho Windows) và FSx for Lustre (HPC hiệu năng cao).
Storage Gateway, Backup, Snow Family
- AWS Storage Gateway AWS Storage Gateway: kết nối hạ tầng on-premises với lưu trữ trên cloud (lưu trữ lai – hybrid).
- AWS Backup AWS Backup: dịch vụ tập trung hóa sao lưu nhiều dịch vụ AWS (EBS, RDS, DynamoDB, EFS...) với chính sách thống nhất.
- AWS Snow Family AWS Snow Family (Snowball, Snowcone): thiết bị vật lý để di chuyển lượng dữ liệu lớn (hàng TB–PB) khi đường truyền mạng quá chậm.
Đừng nhầm
Cần chuyển petabyte dữ liệu lên cloud mà mạng không đủ băng thông → Snow Family (thiết bị vật lý), không phải tải qua Internet hay Direct Connect cho khối lượng cực lớn một lần.
Tóm tắt
- Ba loại lưu trữ: object (S3), block (EBS), file (EFS/FSx).
- S3: object, độ bền 11 số 9; chọn storage class theo tần suất truy cập; Glacier cho archive rẻ.
- EBS: ổ đĩa block cho một EC2, có snapshot; EFS/FSx: file chia sẻ nhiều máy chủ.
- Storage Gateway (hybrid), AWS Backup (sao lưu tập trung), Snow Family (di chuyển dữ liệu lớn).