節點故障恢復
如果 MinIO 節點遭受完全硬體故障(例如,所有硬碟、資料等遺失),一旦節點重新加入部署,節點就會開始修復操作。MinIO 修復僅在替換的硬體上進行,通常不會影響部署效能。
MinIO 修復可確保還原到硬碟上的所有資料的一致性和正確性。
獨佔存取硬碟
MinIO 要求對提供用於物件儲存的硬碟或磁碟區具有獨佔存取權。其他程序、軟體、腳本或人員不應直接對提供給 MinIO 的硬碟或磁碟區或 MinIO 放置在其上的物件或檔案執行任何動作。
除非 MinIO 工程部門指示,否則請勿使用腳本或工具來直接修改、刪除或移動提供的硬碟上的任何資料分片、同位分片或中繼資料檔案,包括從一個硬碟或節點移動到另一個。此類操作很可能會導致廣泛的損壞和資料遺失,超出 MinIO 的修復能力。
替換節點的硬體應與故障節點基本相似。使用改良的硬體不會產生負面效能影響。
替換硬碟的硬體應與故障硬碟基本相似。例如,用相同容量的另一個 SSD 硬碟替換故障的 SSD。雖然您可以使用容量更大的硬碟,但 MinIO 會使用最小硬碟的容量作為伺服器池中所有硬碟的上限。
以下步驟提供更詳細的節點替換演練。這些步驟假設 MinIO 部署中,每個節點都有一個 DNS 主機名稱,如文件中記錄的先決條件所述。
1) 啟動替換節點
請確保新節點已依照產業、法規或組織標準與要求,接收所有必要的安全性、韌體和作業系統更新。
新節點的軟體配置必須與部署中的其他節點相符,包括但不限於作業系統和核心版本及配置。異質的軟體配置可能導致部署中出現意外或不想要的行為。
2) 更新新節點的主機名稱
選用:只有在替換節點的 IP 位址與故障主機不同時,才需要此步驟。
確保與故障節點相關聯的主機名稱現在解析到新節點。
例如,如果 https://minio-1.example.net
先前解析到故障主機,則現在應解析到新主機。
3) 下載並準備 MinIO 伺服器
請依照部署程序下載並執行 MinIO 伺服器,並使用與部署中所有其他節點相符的配置。
所有節點的 MinIO 伺服器版本必須相同。
所有節點的 MinIO 服務和環境檔案配置必須相同。
4) 將節點重新加入部署
在新節點上啟動 MinIO 伺服器程序,並使用 mc admin logs
監控程序輸出,或使用 journalctl -u minio
監控 MinIO 服務日誌(適用於 systemd
管理的安裝)。
伺服器輸出應指示它已偵測到部署中的其他節點,並開始修復操作。
使用 mc admin heal
監控部署上的整體修復狀態。MinIO 會積極修復節點,以確保從降級狀態快速恢復。
5) 後續步驟
繼續監控部署,直到修復完成。具有持續且重複節點故障的部署應排程專門的維護,以找出根本原因。考慮使用 MinIO SUBNET 與 MinIO 工程團隊協調,以取得任何此類操作的指導。