Domain 3 · 10 phút đọc

Dịch vụ lưu trữ: S3, EBS, EFS, FSx

Storage Services: S3, EBS, EFS, FSx

AWS có nhiều dịch vụ lưu trữ cho các nhu cầu khác nhau. Điều quan trọng nhất khi thi là phân biệt ba loại lưu trữ: object, block và file — rồi ánh xạ chúng tới đúng dịch vụ.

Ba loại lưu trữ

LoạiDữ liệu được tổ chức thế nàoDịch vụ AWS chínhVí dụ dùng
ObjectTệp + metadata, truy cập qua API/HTTP, không gắn vào một máy chủAmazon S3Ảnh, video, backup, data lake, hosting tĩnh
BlockChia thành block, gắn (mount) vào một instance như ổ cứngAmazon EBSỔ đĩa cho EC2, cơ sở dữ liệu
FileHệ thống tệp phân cấp (thư mục), nhiều máy chủ truy cập cùng lúcAmazon EFS, Amazon FSxChia sẻ file giữa nhiều EC2

Trọng tâm thi

Một câu hỏi phổ biến: "nhiều EC2 cần truy cập cùng một hệ thống tệp đồng thời" → Amazon EFS (file). "Ổ đĩa cho một instance, hiệu năng cao cho database" → EBS (block). "Lưu hàng triệu tệp/ảnh, truy cập qua web" → Amazon S3 (object).

Amazon S3

Amazon S3 Amazon Simple Storage Service là kho lưu trữ object với độ bền cực cao (99.999999999% — "11 số 9" durability). Dữ liệu lưu trong bucket. S3 có nhiều storage class storage class để tối ưu chi phí theo tần suất truy cập:

Storage classPhù hợp với
S3 StandardDữ liệu truy cập thường xuyên
S3 Standard-IA (Infrequent Access)Ít truy cập nhưng cần lấy nhanh khi cần
S3 Intelligent-TieringTự động chuyển tầng khi mẫu truy cập không đoán trước
S3 Glacier Instant RetrievalLưu trữ (archive) truy cập hiếm, lấy tức thì
S3 Glacier Flexible Retrieval / Deep ArchiveLưu trữ dài hạn, giá rẻ nhất, chấp nhận lấy chậm (phút–giờ)

Mẹo

Dữ liệu archive lâu dài, hiếm truy cập, muốn rẻ nhấtS3 Glacier Deep Archive. Có thể dùng S3 Lifecycle S3 Lifecycle để tự động chuyển object sang tầng rẻ hơn theo thời gian.

Amazon EBS

Amazon EBS Amazon Elastic Block Store cung cấp volume block gắn vào instance EC2 — như một ổ cứng. Đặc điểm:

  • Gắn vào một instance tại một thời điểm (trừ tính năng Multi-Attach đặc biệt).
  • Tồn tại độc lập với vòng đời instance (dữ liệu không mất khi tắt instance).
  • Có thể tạo snapshot sao lưu lên S3.
  • EBS volume nằm trong một AZ.

Amazon EFS và Amazon FSx

  • Amazon EFS Amazon Elastic File System: hệ thống tệp NFS cho Linux, tự co giãn, nhiều EC2 dùng chung đồng thời, trải trên nhiều AZ.
  • Amazon FSx Amazon FSx: hệ thống tệp được quản lý cho các nền tảng cụ thể — ví dụ FSx for Windows File Server (SMB cho Windows) và FSx for Lustre (HPC hiệu năng cao).

Storage Gateway, Backup, Snow Family

  • AWS Storage Gateway AWS Storage Gateway: kết nối hạ tầng on-premises với lưu trữ trên cloud (lưu trữ lai – hybrid).
  • AWS Backup AWS Backup: dịch vụ tập trung hóa sao lưu nhiều dịch vụ AWS (EBS, RDS, DynamoDB, EFS...) với chính sách thống nhất.
  • AWS Snow Family AWS Snow Family (Snowball, Snowcone): thiết bị vật lý để di chuyển lượng dữ liệu lớn (hàng TB–PB) khi đường truyền mạng quá chậm.

Đừng nhầm

Cần chuyển petabyte dữ liệu lên cloud mà mạng không đủ băng thông → Snow Family (thiết bị vật lý), không phải tải qua Internet hay Direct Connect cho khối lượng cực lớn một lần.

Tóm tắt

  • Ba loại lưu trữ: object (S3), block (EBS), file (EFS/FSx).
  • S3: object, độ bền 11 số 9; chọn storage class theo tần suất truy cập; Glacier cho archive rẻ.
  • EBS: ổ đĩa block cho một EC2, có snapshot; EFS/FSx: file chia sẻ nhiều máy chủ.
  • Storage Gateway (hybrid), AWS Backup (sao lưu tập trung), Snow Family (di chuyển dữ liệu lớn).