文件

節點故障復原

如果 MinIO 節點遭受完全硬體故障(例如,所有磁碟機、資料等遺失),則節點在重新加入部署後會開始修復作業。MinIO 修復僅在替換的硬體上發生,並且通常不會影響部署效能。

MinIO 修復可確保所有還原到磁碟機的資料的一致性和正確性。

對磁碟機的獨佔存取權

MinIO 要求 獨佔 存取權,才能存取為物件儲存提供的磁碟機或磁碟區。任何其他程序、軟體、指令碼或人員都不應直接對提供給 MinIO 的磁碟機或磁碟區,或 MinIO 將物件或檔案放置在其上的磁碟機或磁碟區執行任何動作。

除非 MinIO 工程部門指示,否則請勿使用指令碼或工具來直接修改、刪除或移動所提供磁碟機上的任何資料碎片、同位碎片或中繼資料檔案,包括從一個磁碟機或節點移動到另一個磁碟機或節點。此類操作很可能導致廣泛的損壞和資料遺失,超出 MinIO 的修復能力範圍。

替換節點的硬體應與故障節點基本相似。使用改良的硬體不會對效能產生負面影響。

替換磁碟機的硬體應與故障磁碟機基本相似。例如,使用另一個相同容量的 SSD 磁碟機替換故障的 SSD。雖然您可以使用容量更大的磁碟機,但 MinIO 會使用 最小 磁碟機的容量作為 伺服器集區中所有磁碟機的上限。

以下步驟提供了節點替換的更詳細逐步說明。這些步驟假設 MinIO 部署中,每個節點都有一個 DNS 主機名稱,如文件中所述的先決條件

1) 啟動替換節點

確保新節點已按照產業、法規或組織標準和要求,收到所有必要的安全、韌體和作業系統更新。

新節點的軟體組態必須與部署中其他節點的組態相符,包括但不限於作業系統和核心版本和組態。異質的軟體組態可能會導致部署中發生意外或不想要的行為。

2) 更新新節點的主機名稱

可選 只有當替換節點的 IP 位址與故障主機不同時,才需要此步驟。

確保與故障節點關聯的主機名稱現在解析為新節點。

例如,如果 https://minio-1.example.net 先前解析為故障主機,則現在應解析為新主機。

3) 下載並準備 MinIO 伺服器

按照部署程序下載並執行 MinIO 伺服器,使用與部署中所有其他節點相符的組態。

  • MinIO 伺服器版本必須在所有節點上匹配

  • MinIO 服務和環境檔案組態必須在所有節點上匹配。

4) 將節點重新加入部署

在節點上啟動 MinIO 伺服器程序,並使用 mc admin logs 或使用 journalctl -u minio 監控 MinIO 服務記錄,以取得 systemd 管理的安裝,來監控程序輸出。

伺服器輸出應指示它已偵測到部署中的其他節點,並已開始修復作業

使用 mc admin heal 來監控部署的整體修復狀態。MinIO 會積極修復節點,以確保從降級狀態快速恢復。

5) 後續步驟

持續監控部署,直到修復完成。對於持續且重複發生節點故障的部署,應安排專門的維護來找出根本原因。考慮使用 MinIO SUBNET 與 MinIO 工程團隊協調,以獲得任何此類操作的指導。