3

Bài đăng này qua Esen Sagynov là của Jun Sung Won.

OwFS, HDFS, NFS ...  Chúng ta cần loại hệ thống tệp phân tán nào để cung cấp dịch vụ internet cạnh tranh hơn?

Trong bài viết này, tôi sẽ giải thích các tính năng của các hệ thống tệp phân tán được chọn mà tôi có kinh nghiệm làm việc tại  NHN và đề xuất cái nào phù hợp với trường hợp nào. Tôi cũng sẽ thảo luận về các hệ thống tệp phân tán nguồn mở gần đây cũng như hệ thống tệp phân tán của Google chưa được NHN sử dụng. Bài viết này cũng sẽ đề cập đến xu hướng phát triển của các hệ thống tệp phân tán nói chung.

Chúng ta cần sử dụng loại hệ thống tệp phân tán nào?

Hiện tại NHN sử dụng các hệ thống tệp phân tán khác nhau như NFS, CIFS, HDFS và OwFS. Hệ thống tệp phân tán là một hệ thống tệp cho phép truy cập vào tệp qua mạng. Ưu điểm của hệ thống tệp phân tán là bạn có thể chia sẻ dữ liệu giữa nhiều máy chủ. Trước năm 2008, NHN chỉ sử dụng NFS và CIFS bằng cách sử dụng NAS, nhưng kể từ năm 2008, nó đã phát triển và bắt đầu sử dụng OwFS của riêng mình và việc sử dụng OwF đã tăng lên. Như được biết đến rộng rãi, HDFS là một hệ thống tệp nguồn mở chịu ảnh hưởng của GFS của Google.

Đối với NFS hoặc CIFS, Lưu trữ đính kèm mạng (NAS), một hệ thống lưu trữ đắt tiền, thường được sử dụng. Bất cứ khi nào bạn tăng công suất của nó, do đó, có một chi phí cơ sở hạ tầng cao. Mặt khác, vì OwFS và HDFS cho phép bạn sử dụng phần cứng tương đối tiết kiệm (máy chủ hàng hóa), bạn có thể thiết lập lưu trữ dung lượng cao với chi phí thấp hơn nhiều.

Tuy nhiên, OwFS hoặc HDFS không tốt hơn NFS hoặc CIFS, sử dụng NAS trong mọi trường hợp. Đối với một số mục đích, bạn nên sử dụng NAS. Điều tương tự cũng đúng với OwFS và HDFS. Vì chúng được xây dựng cho các mục đích khác nhau, bạn cần chọn một trong những hệ thống tệp này theo mục đích của máy chủ internet bạn đang triển khai.

NFS và CIFS

Nói chung, Hệ thống tệp mạng (NFS) được Linux / Unix sử dụng, trong khi CIFS (Hệ thống tệp Internet chung) được sử dụng bởi MS Windows. NFS là một hệ thống tệp phân tán được phát triển vào năm 1984 bởi Sun microsystems. Nó cho phép bạn chia sẻ và sử dụng các tập tin từ các máy chủ khác thông qua mạng. NFS có nhiều phiên bản và nó bắt đầu được sử dụng rộng rãi từ phiên bản NFSv2. Hiện tại, phiên bản được sử dụng nhiều nhất là NFSv3. Năm 2003, NFSv4 đã được phát hành, và cung cấp hiệu suất và bảo mật tốt hơn. Trong năm 2010, NFSv4.1, hỗ trợ mở rộng dựa trên cụm, đã được phát hành. NFS là một hệ thống tệp phân tán có lịch sử lâu dài và nó tiếp tục phát triển.

CIFS là một hệ thống tệp phân tán được Microsoft áp dụng cho MS Windows, được phát triển dựa trên Khối tin nhắn máy chủ (SMB) nhưng với các chức năng nâng cao, bao gồm bảo mật.

NFS và CIFS tuân thủ tiêu chuẩn POSIX. Do đó, các ứng dụng bằng cách sử dụng NFS hoặc CIFS có thể sử dụng hệ thống tệp phân tán như hệ thống tệp cục bộ. Điều này có nghĩa là, khi bạn triển khai hoặc chạy một ứng dụng, bạn không cần phải chuẩn bị một hệ thống tệp cục bộ và hệ thống tệp phân tán.

Khi NFS hoặc CIFS được sử dụng, Bộ lưu trữ đính kèm mạng (NAS) được sử dụng để có hiệu suất và tính khả dụng tốt hơn. NAS có hệ thống tệp duy nhất và xử lý các yêu cầu từ xa để truy cập vào các tệp bằng cách có cổng NAS hỗ trợ các giao thức NFS hoặc CIFS.

Nói chung, NAS có cấu trúc như trong Hình 1:

Hình 1: Cấu trúc chung của NAS.

Các tính năng của NFS hoặc CIFS như sau:

  • Cung cấp chức năng tương tự như một hệ thống tệp cục bộ.
  • Vì họ chủ yếu sử dụng NAS, nên có chi phí mua hàng cao.
  • Khả năng mở rộng của NAS rất thấp so với OwFS và HDFS.

OwFS (Hệ thống tệp dựa trên chủ sở hữu)

OwFS là một hệ thống tệp phân tán được phát triển bởi NHN. Hiện tại, đây là hệ thống tệp phân tán mà NHN sử dụng nhiều nhất. OwFS có khái niệm về một  container  được gọi là  chủ sở hữu . Chủ sở hữu là một đơn vị siêu dữ liệu cơ bản được quản lý trong OwFS. OwFS quản lý các bản sao dữ liệu trên cơ sở của chủ sở hữu này. Mỗi chủ sở hữu có một không gian lưu trữ tệp độc lập, trong đó các tệp và thư mục có thể được lưu trữ. OwFS tạo thành một hệ thống tệp khổng lồ bằng cách tập hợp các chủ sở hữu này lại với nhau. Để truy cập một tập tin, người dùng cần có được thông tin của chủ sở hữu đầu tiên. Cấu trúc tổng thể của OwFS như sau:

Hình 2: Cấu trúc OwFS.

Máy chủ  siêu dữ liệu  (MDS) của OwFS quản lý trạng thái của máy chủ dữ liệu (DS). Cụ thể hơn, MDS quản lý dung lượng của mỗi DS và khi xảy ra lỗi, nó thực hiện công việc khôi phục bằng cách sử dụng bản sao của chủ sở hữu.

So với HDFS, ưu điểm của OwFS là nó có thể xử lý một số lượng lớn tệp một cách hiệu quả (chủ yếu khi kích thước của tệp nằm trong hàng chục MB). Điều này là do OwFS đã được thiết kế để không làm tăng gánh nặng của MDS ngay cả khi số lượng tệp tăng lên. DS quản lý thông tin trên các tệp và thư mục được lưu trữ trong chủ sở hữu  (nghĩa là siêu dữ liệu trên tệp và thư mục), trong khi MDS chỉ có thông tin của chủ sở hữu và vị trí của bản sao của chủ sở hữu. Vì lý do này, ngay cả khi số lượng tệp tăng lên, siêu dữ liệu, mà MDS nên xử lý, không tăng và do đó, gánh nặng của MDS không tăng nhiều.

Phần sau đây cho thấy các tính năng của OwFS:

  • Chủ sở hữu, một loại bộ chứa, là một hệ thống tệp duy nhất và chủ sở hữu tạo thành toàn bộ hệ thống tệp.
  • Thông tin chủ sở hữu (dữ liệu tệp và siêu dữ liệu) được lưu trữ trong máy chủ dữ liệu (DS).
  • Nhiều chủ sở hữu có thể được lưu trong một DS và chủ sở hữu được phân phối và lưu trữ (sao chép) trong các DS khác nhau.
  • Thông tin về vị trí của chủ sở hữu bao gồm cả vị trí của bản sao được lưu trữ trong Máy chủ dữ liệu siêu dữ liệu (MDS).
  • Nó phù hợp để xử lý một số lượng lớn các tệp có kích thước trong phạm vi hàng chục MB.
  • Vì tất cả các thành phần của nó được nhân đôi / ba lần, nó hoạt động ổn định ngay cả khi xảy ra lỗi.
  • Khung Map-Giảm cho OwFS cũng tồn tại.
  • Mô-đun Apache để hiển thị các tệp từ OwFS.
  • Mô-đun OwFs_Fuse để gắn kết OwFS như NAS.

OwFS cung cấp giao diện độc đáo (API). Tuy nhiên, vì nó cũng cung cấp mô-đun OwFs_Fuse, bạn có thể gắn OwFS như NAS và sử dụng nó như một đĩa cục bộ. Ngoài ra, nó cũng cung cấp mô-đun Apache để máy chủ web Apache có thể truy cập các tệp được lưu trữ trong OwFS.

Hệ thống tệp phân tán Hadoop (HDFS)

Google đã phát triển Google File System (GFS), hệ thống phân phối duy nhất của nó, nơi lưu trữ thông tin về các trang web được Google thu thập thông tin. Google đã xuất bản một bài báo về GFS năm 2003. HDFS (Hadoop) là một hệ thống nguồn mở được phát triển bằng cách sử dụng GFS làm mô hình.

Vì lý do này, HDFS có các đặc điểm giống như GFS. HDFS tách một tệp lớn thành các khối và lưu trữ ba trong số chúng vào mỗi nút dữ liệu. Nói cách khác, một tệp được lưu trữ trong nhiều nút dữ liệu phân tán. Điều này cũng có nghĩa là một tệp có ba bản sao. Kích thước điển hình của một khối là 64 MB.

Siêu dữ liệu về nút dữ liệu nào lưu trữ đoạn dữ liệu được lưu trữ trong nút  tên . Điều này cho phép bạn đọc dữ liệu từ các tệp phân tán và thực hiện các thao tác bằng cách sử dụng MapReduce.

Hình 2  bên dưới cho thấy cấu hình của HDFS:

Hình 2: Cấu trúc HDFS  ( http://hadoop.apache.org/docs/hdfs/civerse/hdfs_design.html ) .

Nút tên của HDFS quản lý không gian tên và siêu dữ liệu của tất cả các tệp và thông tin trên các khối tệp. Chun được lưu trữ trong các nút dữ liệu và các nút dữ liệu này xử lý các yêu cầu hoạt động tệp từ máy khách.

Như đã giải thích ở trên, trong HDFS, các tệp lớn có thể được phân phối và lưu trữ hiệu quả. Hơn nữa, bạn cũng có thể thực hiện xử lý phân tán các hoạt động bằng cách sử dụng khung MapReduce dựa trên thông tin vị trí khối.

So với OwFS, điểm yếu của HDFS là nó không phù hợp để xử lý một số lượng lớn tệp. Điều này là do một nút cổ chai có thể xảy ra ở nút tên. Nếu số lượng tệp tăng lên, OOM (Hết bộ nhớ) xảy ra tại trình nền dịch vụ của nút tên và do đó, quá trình trình nền bị chấm dứt.

Các tính năng của HDFS như sau:

  • Một tệp lớn được chia thành các khối và phân phối và lưu trữ thành nhiều nút dữ liệu.
  • Kích thước của một đoạn thường là 64 MB, mỗi đoạn có ba bản sao và các đoạn được lưu trữ trong các nút dữ liệu khác nhau.
  • Thông tin về các khối này được lưu trữ trong nút tên.
  • Đó là thuận lợi cho việc lưu trữ các tệp lớn, mặc dù nếu số lượng tệp lớn, gánh nặng của nút tên sẽ tăng lên.
  • Nút tên là SPOF và nếu xảy ra lỗi ở nút tên, HDFS sẽ dừng và phải được khôi phục thủ công.

Vì HDFS được viết bằng Java, giao diện (API) của nó cũng là API Java. Tuy nhiên, bạn cũng có thể sử dụng API C bằng cách sử dụng JNI. Cộng đồng Hadoop không cung cấp tiện ích cho việc sử dụng FUSE chính thức. Nhưng một bên thứ ba cung cấp chức năng của FUSE mount cho HDFS.

Những gì bạn nên biết khi sử dụng HDFS là biện pháp chống lại sự thất bại trong nút tên. Khi xảy ra lỗi ở nút tên, bạn không thể sử dụng chính HDFS và do đó bạn cần tính đến thời gian xảy ra lỗi. Ngoài ra, do NHN không có nhóm HDFS độc quyền, bộ phận dịch vụ có liên quan phải điều hành và vận hành HDFS của riêng họ.

Bảng 1: OwFS so với HDFS.

Sở hữu

HDFS

Máy chủ siêu dữ liệu dự phòng

Được hỗ trợ.

Chưa được hỗ trợ.

Siêu dữ liệu được quản lý

Thông tin phân bổ chủ sở hữu.

Không gian tên tệp, thông tin tệp (stat. Thông tin.), Thông tin chunk và thông tin phân bổ chunk.

Phương pháp lưu trữ tệp

Không có bất kỳ thay đổi.

Chia thành khối.

Ưu điểm

Thích hợp để lưu trữ nhiều tập tin.

Thích hợp để lưu trữ một tập tin lớn.

Chọn loại lưu trữ phân tán phù hợp cho từng trường hợp

Trường hợp 1

Kích thước của tệp không lớn (thường trong phạm vi hàng chục MB) và số lượng tệp có thể tăng đáng kể. Một không gian khoảng 10 - 100 TB dự kiến ​​sẽ được yêu cầu. Một khi các tập tin được lưu trữ, chúng sẽ khó được sửa đổi.

OwFS là phù hợp. Vì kích thước của tệp nhỏ và số lượng tệp có thể tăng lên, OwFS phù hợp hơn HDFS.

Vì nội dung của các tệp không bị thay đổi và tổng kích thước yêu cầu là hàng chục TB, nên sử dụng OwFS sẽ thuận lợi hơn so với NAS về chi phí.

Trường hợp 2

Bạn cần lưu trữ các tệp nhật ký được tạo từ máy chủ web và phân tích nội dung của chúng theo định kỳ. Kích thước của tệp nhật ký trung bình là 1 TB, khoảng 10 tệp nhật ký được tạo và chúng được duy trì trong một tháng.

HDFS là phù hợp. Điều này là do kích thước của một tệp lớn nhưng số lượng tệp nhỏ. Bạn đã sử dụng HDFS tốt hơn khi phân tích các tệp lớn như vậy. Tuy nhiên, khi tệp được lưu trữ trong HDFS, bạn không thể thay đổi tệp được lưu trữ. Vì lý do này, bạn cần lưu trữ nó trong HDFS sau khi tệp nhật ký được tạo hoàn toàn.

Trường hợp 3

Bạn cần lưu trữ các tệp nhật ký được tạo từ máy chủ web và phân tích nội dung của chúng theo định kỳ. Một tệp nhật ký mỗi ngày được tạo cho mỗi máy chủ và kích thước tệp trung bình là 100 KB. Hiện tại số lượng máy chủ nên thu thập nhật ký là khoảng 10.000 và thời gian lưu tệp là 100 ngày.

Bạn đã sử dụng OwFS tốt hơn. Điều này là do số lượng tệp sẽ tăng lên do thời gian bảo trì 100 ngày và kích thước của tệp nhật ký không lớn.

Công việc phân tích có thể được tiến hành thông qua khung MapReduce. Nếu bạn sử dụng MFO (Map-Giảm khung cho OwFS), bạn cũng có thể sử dụng MapReduce trong OwFS.

Trường hợp 4

Mỗi người dùng có nhiều tệp, bạn muốn thiết lập một chỉ mục thông tin tệp để người dùng có thể tìm kiếm tệp của họ một cách nhanh chóng và bạn cần lưu trữ để lưu trữ tệp chỉ mục. Khi một tệp được thêm, xóa hoặc thay đổi, tệp chỉ mục này sẽ được cập nhật.

Nếu số lượng tệp nhỏ, kích thước của chỉ mục nhỏ. Tuy nhiên, nếu số lượng tệp lớn, tệp chỉ mục có thể nhiều hơn hàng trăm MB. Tổng số người dùng ước tính là 100.000.

NAS là phù hợp. Nói chung, một tệp chỉ mục cần được cập nhật thường xuyên, nhưng trong OwFS hoặc HDFS, các tệp được lưu trữ có thể được sửa đổi.

Với OwFS, nếu bạn sử dụng OwFS_FUSE ở chế độ đầy đủ, bạn có thể thay đổi tệp. Nhưng phương pháp này đọc toàn bộ tập tin, thay đổi và ghi lại nó. Điều này đúng ngay cả khi bạn chỉ cần thay đổi 1 byte trong toàn bộ tệp.

Ngoài ra, nếu toàn bộ kích thước là hàng chục TB, sử dụng NAS cũng sẽ không dẫn đến chi phí cao.

Trường hợp 5

Có hơn 1.000.000 tệp khoảng 1 KB. Tổng kích thước yêu cầu là khoảng 3 GB. Rất khó để thay đổi cấu trúc thư mục hiện có.

NAS là phù hợp. Khi bạn sử dụng OwFS_FUSE, bạn có thể sử dụng cấu trúc thư mục linh hoạt như hệ thống tệp cục bộ. Tuy nhiên, nếu có nhiều tệp nhỏ, nó thường cung cấp hiệu suất thấp hơn so với NAS. HDFS cũng có thể được gắn kết bằng FUSE, nhưng nó không phù hợp trong môi trường sử dụng một số lượng lớn tệp. Ngoài ra, vì tổng kích thước yêu cầu là rất nhỏ, sử dụng NAS sẽ không gây ra chi phí cao.

Trường hợp 6

Kích thước tệp dao động từ vài MB đến vài GB và tổng kích thước yêu cầu là khoảng 500 TB. Cấu trúc thư mục không nên thay đổi và đôi khi nội dung của tệp có thể được thay đổi.

OwFS là phù hợp. Nếu cần kích thước lớn khoảng 500 TB, NAS không phù hợp do chi phí. Nếu kích thước là 500 TB, điều đó có nghĩa là số lượng tệp yêu cầu cũng lớn. Do đó, OwFS phù hợp hơn HDFS. Mặc dù có thể sử dụng cấu trúc thư mục hiện có mà không có bất kỳ thay đổi nào bằng cách sử dụng OwFS-FUSE, tốt hơn là thay đổi nó thành cấu trúc phù hợp hơn với chủ sở hữu. Khi bạn thay đổi nội dung của tệp, bạn có thể ngăn toàn bộ tải hệ thống tăng lên bằng cách đọc và cập nhật tệp trên máy chủ ứng dụng và ghi đè lên từ máy chủ ứng dụng sang OwFS.

Bảng 2: Tiêu chí lựa chọn OwFS, HDFS, NFS / CIFS.

Sở hữu

HDFS

NFS / CIFS

Kích thước tập tin

Thích hợp khi có nhiều tệp nhỏ hàng chục MB. Giữa (<hàng chục GB *)

Lớn (10 GB * >>) Thích hợp khi có nhiều tệp lớn trên 10 GB

Tập tin vừa và nhỏ

Số lượng tập tin

Lớn

Nhỏ bé

Lớn

TCO

Thấp

Thấp

Cao

Chức năng phân tích

Ôi

Ôi

X

Tiêu chí lựa chọn

  • Khi kích thước tập tin nhỏ.
  • Khi số lượng tập tin lớn.
  • Khi cần phân tích.
  • Khi kích thước tập tin lớn.
  • Khi số lượng tập tin nhỏ.
  • Khi công suất lớn.
  • Khi cần phân tích.
  • Khi công suất nhỏ.
  • Khi NAS được sử dụng và cần có khả năng tương thích.

Hệ thống tệp phân tán đáng chú ý

Có một số hệ thống tệp phân tán đáng chú ý khác hiện không được NHN sử dụng. Đó là GFS2, Swift, Ceph và pNFS. Nelow tôi sẽ giới thiệu ngắn gọn về họ và giải thích các chức năng của họ.

GFS2

GFS của Google là để phân phối các hệ thống tệp mà Beatles dành cho ngành công nghiệp âm nhạc, trong đó nhiều hệ thống tệp phân tán, bao gồm HDFS, được lấy cảm hứng từ GFS.

Tuy nhiên, GFS cũng có một điểm yếu lớn về cấu trúc. Nó dễ bị hỏng tên nút. Không giống như HDFS, GFS có một nút tên nô lệ. Đây là lý do tại sao GFS ít bị lỗi hơn HDFS. Mặc dù tên nút nô lệ của nó, tuy nhiên, khi xảy ra lỗi ở nút tên chính, thời gian chuyển không ngắn.

Nếu số lượng tệp tăng lên, số lượng siêu dữ liệu cũng tăng và do đó tốc độ xử lý bị suy giảm và tổng số tệp có sẵn cũng bị giới hạn do giới hạn kích thước bộ nhớ của máy chủ chính.

Thông thường kích thước của một đoạn là 64 MB và GFS quá kém hiệu quả để lưu trữ dữ liệu nhỏ hơn kích thước này. Tất nhiên, bạn có thể giảm kích thước của một đoạn, nhưng nếu bạn giảm kích thước, lượng siêu dữ liệu sẽ tăng lên. Vì lý do này, ngay cả khi có nhiều tệp nhỏ hơn 64 MB, vẫn khó giảm kích thước của một đoạn.

Tuy nhiên, GFS2 khắc phục điểm yếu này của GFS. GFS2 sử dụng phương pháp quản lý siêu dữ liệu tiên tiến hơn nhiều so với GFS. Nút tên của GFS2 có cấu trúc phân tán chứ không phải là một bản gốc duy nhất. Ngoài ra, nó lưu trữ siêu dữ liệu trong cơ sở dữ liệu có thể sửa được, chẳng hạn như BigTable. Thông qua đó, GFS2 giải quyết giới hạn số lượng tệp và lỗ hổng đối với lỗi nút tên.

Vì bạn có thể dễ dàng tăng lượng siêu dữ liệu cần xử lý, bạn có thể giảm kích thước của một đoạn dữ liệu xuống còn 1 MB. Cấu trúc của GFS2 dự kiến ​​sẽ có ảnh hưởng rất lớn đến các cách tiếp cận để cải thiện cấu trúc của hầu hết các hệ thống tệp phân tán khác.

Nhanh

Swift là một hệ thống lưu trữ đối tượng được sử dụng trong OpenStack, được sử dụng bởi Rackspace Cloud và các hệ thống khác. Swift sử dụng cấu trúc trong đó không có máy chủ chính riêng biệt như Amazon S3. Nó sử dụng cấu trúc đối tượng 3 cấp (Tài khoản, Container và Đối tượng) để quản lý tệp. Đối tượng Tài khoản là một loại tài khoản được sử dụng để quản lý các container. Đối tượng Container là một đối tượng được sử dụng để quản lý đối tượng Object giống như một thư mục. Nó giống như một cái xô trong Amazon S3. Đối tượng là một đối tượng tương ứng với một tệp. Để truy cập Đối tượng này, bạn nên truy cập đối tượng Tài khoản và đối tượng Container, theo thứ tự đó. Swift cung cấp API REST và có một máy chủ proxy để cung cấp API REST. Nó sử dụng một bảng tĩnh với vị trí được xác định trước mà một đối tượng đã được phân bổ và đây được gọi là Ring.

Khi việc sử dụng OpenStack đang phát triển nhanh chóng với sự tham gia của ngày càng nhiều công ty lớn, Swift gần đây đã được chú ý nhiều hơn. Tại Hàn Quốc, KT đang tham gia OpenStack và cung cấp máy chủ KT uCloud bằng cách sử dụng Swift.

Ceph

Ceph là một hệ thống tệp phân tán với phương thức quản lý siêu dữ liệu duy nhất. Giống như các hệ thống tệp phân tán khác, nó cũng quản lý không gian tên và siêu dữ liệu của toàn bộ hệ thống tệp bằng cách sử dụng máy chủ siêu dữ liệu. Nhưng nó có tính năng hoạt động của các máy chủ siêu dữ liệu theo cụm và điều chỉnh động của khu vực không gian tên theo siêu dữ liệu theo mức độ tải. Điều này cho phép bạn dễ dàng phản hồi khi tải tập trung vào một số phần và dễ dàng mở rộng máy chủ siêu dữ liệu. Hơn nữa, không giống như các hệ thống tệp phân tán khác, nó tương thích với POSIX. Điều này có nghĩa là bạn có thể truy cập một tệp được lưu trữ trong hệ thống tệp phân tán như trong hệ thống tệp cục bộ.

Nó cũng hỗ trợ API REST và tương thích với API REST của Swift hoặc Amazon S3.

Điều đáng chú ý nhất về Ceph là nó được bao gồm trong nguồn Linux Kernel. Phiên bản phát hành rất cao, nhưng khi Linux phát triển, Ceph cuối cùng có thể trở thành hệ thống tệp chính của Linux. Nó cũng hấp dẫn vì nó tương thích với POSIX và hỗ trợ kernel kernel.

Hệ thống tệp mạng song song (pNFS)

Như đã đề cập ở trên, NFS có nhiều phiên bản. Để giải quyết vấn đề về khả năng mở rộng của các phiên bản lên đến NFSv4, NFSv4.1 đã giới thiệu pNFS. Phiên bản này cho phép bạn xử lý riêng nội dung của tệp và siêu dữ liệu của tệp đó và lưu trữ một tệp ở nhiều nơi được phân phối. Nếu máy khách mang siêu dữ liệu của một tệp nhất định và tìm hiểu vị trí của tệp, nó sẽ được kết nối với các máy chủ chứa nội dung của tệp khi truy cập cùng một tệp sau đó. Tại thời điểm này, khách hàng có thể đọc hoặc ghi nội dung của tệp trong nhiều máy chủ song song. Bạn cũng có thể dễ dàng mở rộng máy chủ siêu dữ liệu, nơi quản lý siêu dữ liệu, để ngăn chặn sự xuất hiện của hiện tượng thắt cổ chai.

pNFS là phiên bản nâng cao của NFS và phản ánh xu hướng gần đây của các hệ thống tệp phân tán. Do đó, pNFS có những lợi thế của NFS, cũng như những lợi thế của các hệ thống tệp phân tán mới nhất. Hiện tại, có một số sản phẩm hỗ trợ pNFS được phát hành.

Một trong những lý do chúng ta nên chú ý đến pNFS là hiện tại NFS không được quản lý bởi Oracle (Sun) mà bởi Lực lượng đặc nhiệm kỹ thuật Internet (IETF). NFS được sử dụng làm tiêu chuẩn trong nhiều môi trường Linux / Unix và do đó pNFS có thể được phổ biến nếu nhiều nhà cung cấp phát hành các sản phẩm hỗ trợ pNFS.

Phần kết luận

Cho đến nay, bạn đã biết rằng nhiều hệ thống tệp phân tán có các đặc điểm riêng của chúng và bạn cần áp dụng một hệ thống tệp phân tán phù hợp tùy thuộc vào nhu cầu kinh doanh của bạn. Bài viết này cũng giới thiệu một số hệ thống tệp phân tán mà mọi người đã bắt đầu chú ý và giải thích các xu hướng mới và những điều bạn có thể tham khảo.

|