文件

節點故障恢復

如果 MinIO 節點遭受完全硬體故障(例如,所有硬碟、資料等遺失),則該節點一旦重新加入部署,就會開始修復操作。MinIO 修復僅發生在更換的硬體上,通常不會影響部署效能。

MinIO 修復確保還原到硬碟上的所有資料的一致性和正確性。

對硬碟的獨佔存取

MinIO **要求**對提供用於物件儲存的硬碟或磁碟區具有_獨佔_存取權。其他任何程序、軟體、腳本或人員都不應直接對提供給 MinIO 的硬碟或磁碟區,或 MinIO 放置在其上的物件或檔案執行_任何_操作。

除非 MinIO 工程部門指示,否則請勿使用腳本或工具直接修改、刪除或移動所提供硬碟上的任何資料分片、同位分片或中繼資料檔案,包括從一個硬碟或節點移動到另一個硬碟或節點。此類操作很可能導致廣泛的損壞和資料遺失,超出 MinIO 的修復能力。

替換節點的硬體應與故障節點大致相似。使用改良的硬體不會產生負面的效能影響。

替換硬碟的硬體應與故障硬碟大致相似。例如,將故障的 SSD 更換為另一個容量相同的 SSD 硬碟。雖然您可以使用容量較大的硬碟,但 MinIO 會將_最小_硬碟的容量用作伺服器池中所有硬碟的上限。

以下步驟提供更詳細的節點更換逐步說明。這些步驟假設 MinIO 部署中每個節點都有一個 DNS 主機名稱,如記載的先決條件所示。

1) 啟動替換節點

確保新節點已按照產業、法規或組織標準和要求接收所有必要的安全性、韌體和作業系統更新。

新節點的軟體配置_必須_與部署中其他節點的軟體配置相符,包括但不限於作業系統和核心版本以及配置。異質軟體配置可能會導致部署中出現意外或不良行為。

2) 更新新節點的主機名稱

_選用_ 只有在替換節點與故障主機具有不同的 IP 位址時,才需要執行此步驟。

確保與故障節點關聯的主機名稱現在會解析為新節點。

例如,如果 https://minio-1.example.net 先前解析為故障主機,則現在應解析為新主機。

3) 下載並準備 MinIO 伺服器

依照部署程序下載並執行 MinIO 伺服器,並使用與部署中所有其他節點相符的配置。

  • MinIO 伺服器版本_必須_與所有節點相符

  • MinIO 服務和環境檔案配置_必須_與所有節點相符。

4) 將節點重新加入部署

在節點上啟動 MinIO 伺服器進程,並使用 mc admin logs 或透過監控 MinIO 服務日誌(針對 systemd 管理的安裝使用 journalctl -u minio)來監控進程輸出。

伺服器輸出應指示它已偵測到部署中的其他節點,並開始 修復操作

使用 mc admin heal 來監控部署的整體修復狀態。MinIO 會積極修復節點,以確保從降級狀態快速恢復。

5) 後續步驟

持續監控部署直到修復完成。發生持續且重複節點故障的部署應安排專門的維護來找出根本原因。考慮使用 MinIO SUBNET 與 MinIO 工程團隊協調,以獲得任何此類操作的指導。