硬體故障後復原
分散式 MinIO 部署仰賴 抹除編碼 來提供對多個磁碟機或節點故障的內建容錯能力。根據部署拓撲和選取的抹除碼同位,MinIO 可以容忍部署中最多一半的磁碟機或節點遺失,同時維持對物件的讀取存取權(「讀取仲裁」)。
下表列出 MinIO 部署中典型的故障類型,並連結到每個故障復原程序
故障類型 |
描述 |
---|---|
MinIO 支援使用新的健全磁碟機熱插拔故障磁碟機。 |
|
MinIO 會偵測到節點何時重新加入部署,並在節點重新加入叢集後不久,主動開始修復先前儲存在該節點上的資料。 |
|
MinIO 站點複製支援在整個站點遺失後完整重新同步儲存區、物件和符合複製資格的組態設定。 |
由於 MinIO 可以在效能沒有明顯損失的情況下以降級狀態運作,因此管理員可以根據硬體故障率安排硬體更換。「正常」故障率(單一磁碟機或節點故障)可能允許較合理的更換時程,而「嚴重」故障率(多個磁碟機或節點)可能需要更快的響應速度。
對於具有一個或多個部分故障或以降級狀態運作的磁碟機(磁碟機錯誤增加、SMART 警告、MinIO 記錄中的逾時等)的節點,如果叢集有足夠的剩餘健全磁碟機來維持 讀取和寫入仲裁,則可以安全地卸載磁碟機。遺失的磁碟機對部署的破壞性小於持續產生讀取和寫入錯誤的磁碟機。
磁碟機的獨佔存取權
MinIO 要求 獨佔存取為物件儲存提供的磁碟機或磁碟區。其他程序、軟體、指令碼或人員不應直接對提供給 MinIO 的磁碟機或磁碟區,或 MinIO 放置在它們上的物件或檔案執行任何動作。
除非 MinIO 工程部門指示,否則請勿使用指令碼或工具直接修改、刪除或移動提供的磁碟機上的任何資料分片、同位分片或中繼資料檔案,包括從一個磁碟機或節點移動到另一個。此類操作很可能會導致廣泛的損壞和資料遺失,超出 MinIO 的修復能力。
MinIO 專業支援
MinIO SUBNET 使用者可以登入並建立與磁碟機、節點或站點故障相關的新問題。透過 SUBNET 與 MinIO 工程部門協調可以確保生產 MinIO 部署的成功復原操作,包括根本原因分析和健康狀況診斷。
社群使用者可以在MinIO 社群 Slack上尋求支援。社群支援僅為盡力而為,並且沒有關於回應能力的 SLA。