抹除編碼
MinIO 實作抹除編碼作為提供資料冗餘和可用性的核心組件。本頁提供 MinIO 抹除編碼的簡介。
有關 MinIO 如何在生產部署中使用抹除編碼的更多資訊,請參閱 可用性和彈性 和 部署架構。
抹除編碼基礎
注意
本節中的圖表和內容呈現 MinIO 抹除編碼操作的簡化視圖,並不旨在代表 MinIO 完整抹除編碼實作的複雜性。
- MinIO 將每個 伺服器池 中的磁碟機分組為一個或多個大小相同的 抹除集。
上面的範例部署包含 4 個節點,每個節點有 4 個磁碟機。MinIO 初始化時使用包含所有四個節點上所有 16 個磁碟機的單個抹除集。
MinIO 在初始化 伺服器池 時決定抹除集的最佳數量和大小。您無法在初始設定後修改這些設定。
- 對於每個寫入操作,MinIO 將物件分割為 資料 和 同位 分片。
抹除集條帶大小決定了部署的最大可能 同位。用於決定要產生多少資料和同位分片的公式為
N (ERASURE SET SIZE) = K (DATA) + M (PARITY)
上面的範例部署具有 16 個磁碟機的抹除集。這可以支援介於
EC:0
和 1/2 抹除集磁碟機之間的同位,或EC:8
。- 您可以將同位值設定在 0 到抹除集大小的 1/2 之間。
MinIO 使用 Reed-Solomon 抹除編碼實作,並分割物件以分配到整個抹除集中。上面的範例部署的抹除集大小為 16,同位為
EC:4
如果您稍後變更同位值,則使用給定同位設定寫入的物件不會自動更新。
- MinIO 需要最少
K
個任何類型的分片才能讀取物件。 此處的值
K
構成部署的讀取仲裁。因此,抹除集必須在抹除集中至少有K
個健全的磁碟機才能支援讀取操作。此部署有一個離線節點,導致只有 12 個剩餘的健全磁碟機。該物件以
EC:4
寫入,讀取仲裁為K=12
。因此,此物件維持讀取仲裁,並且 MinIO 可以重建它以進行讀取操作。當 MinIO 失去讀取仲裁時,無法重建物件。這些物件可能需要透過其他方式復原,例如 複製同步。
- MinIO 至少需要
K
個 erasure set 磁碟機才能寫入物件。 此處的數值
K
構成部署的寫入仲裁。因此,erasure set 必須至少有K
個可用的線上磁碟機才能支援寫入操作。此部署有一個節點離線,導致僅剩下 12 個健康磁碟機。客戶端使用
EC:4
同位設定寫入物件,其中 erasure set 的寫入仲裁為K=12
。此 erasure set 維持寫入仲裁,且 MinIO 可以將其用於寫入操作。- 如果同位
EC:M
剛好是 erasure set 大小的一半,則寫入仲裁為K+1
。 這可防止發生腦裂類型的狀況,例如網路問題導致 erasure set 磁碟機的一半與另一半隔離。
由於暫時性的網路故障,此部署有兩個節點離線。客戶端使用
EC:8
同位設定寫入物件,其中 erasure set 的寫入仲裁為K=9
。此 erasure set 已失去寫入仲裁,且 MinIO 無法將其用於寫入操作。K+1
的邏輯確保客戶端不會可能將同一個物件寫入兩次 - 分別寫入 erasure set 的每個「一半」。- 對於維持讀取仲裁的物件,MinIO 可以使用任何資料或同位分片來 修復 受損的分片。
一個
EC:4
的物件由於磁碟機故障而遺失 12 個中的 4 個資料分片。由於物件維持了讀取仲裁,MinIO 可以使用可用的同位分片來修復那些遺失的資料分片。
使用 MinIO Erasure Coding 計算器 來探索您計畫的拓樸結構中可能的 erasure set 大小和分佈。在可能的情況下,使用偶數個節點和每個節點的磁碟機,以簡化拓樸規劃和磁碟機/erasure set 分佈的概念化。
磁碟機的獨佔存取權
MinIO 需要對用於物件儲存的磁碟機或磁碟區具有獨佔存取權。其他程序、軟體、指令碼或人員都不應直接對提供給 MinIO 的磁碟機或磁碟區,或 MinIO 放置在其上的物件或檔案執行任何動作。
除非 MinIO 工程部門指示,否則請勿使用指令碼或工具來直接修改、刪除或移動所提供磁碟機上的任何資料分片、同位分片或中繼資料檔案,包括從一個磁碟機或節點移動到另一個磁碟機或節點。此類操作很可能會導致廣泛的損毀和資料遺失,超出 MinIO 的修復能力範圍。
Erasure 同位與儲存效率
為部署設定同位是在可用性和總可用儲存空間之間取得平衡。較高的同位值可以提高對磁碟機或節點故障的復原能力,但會犧牲可用儲存空間,而較低的同位則可提供最大的儲存空間,但對磁碟機/節點故障的容忍度較低。使用 MinIO Erasure Code 計算器 來探索同位對您計畫叢集部署的影響。
下表列出在由 1 個節點和 16 個 1TB 磁碟機組成的 MinIO 部署中,不同 erasure code 同位級別的結果
同位 |
總儲存空間 |
儲存空間比例 |
讀取操作的最小磁碟機數量 |
寫入操作的最小磁碟機數量 |
---|---|---|---|---|
|
12 Tebibytes |
0.750 |
12 |
12 |
|
10 Tebibytes |
0.625 |
10 |
10 |
|
8 Tebibytes |
0.500 |
8 |
9 |
位元衰減保護
位元衰減是指儲存媒體層級上隨機變更導致的無聲資料損毀。對於資料磁碟機,這通常是由於代表資料的電荷或磁性方向衰減所致。這些來源範圍可能從停電期間的小電流突波到隨機宇宙射線導致的位元翻轉。產生的「位元衰減」可能會在資料媒介上導致細微的錯誤或損毀,而不會觸發監控工具或硬體。
MinIO 對 HighwayHash 演算法的優化實作可確保其能即時擷取和修復損毀的物件。從應用程式、跨網路到記憶體或磁碟機,透過在讀取時計算雜湊並在寫入時驗證雜湊,確保端到端的完整性。此實作專為速度而設計,可以在 Intel CPU 的單核心上達到超過 10 GB/秒的雜湊速度。