核心操作概念
MinIO 部署的元件有哪些?
MinIO 部署由一組儲存和計算資源組成,這些資源執行一個或多個 minio server
節點,這些節點共同充當單一物件儲存庫。
MinIO 的獨立實例由具有單個 minio server
節點的單個伺服器池組成。獨立實例最適合用於初始開發和評估。
MinIO 部署可以直接在 裸機
或非虛擬化基礎架構中的實體裝置上執行。或者,MinIO 可以在雲服務上的虛擬機器內執行,例如使用 Docker、Podman 或 Kubernetes。MinIO 可以在本機、私有雲或市場上任何可用的公有雲中執行。
您設計、架構和建置系統的特定方式稱為系統的 拓撲
。
MinIO 支援哪些系統拓撲?
MinIO 可以部署到三種拓撲類型
分散式 MinIO 部署如何運作?
分散式部署利用多個實體或虛擬機器的運算和儲存資源。在現代情況下,這通常意味著在私有或公共雲環境中運行 MinIO,例如 Amazon Web Services、Google Cloud Platform、Microsoft 的 Azure 平台或許多其他平台。
MinIO 如何管理多個虛擬或實體伺服器?
雖然測試 MinIO 可能只涉及單一電腦上的單一硬碟,但大多數生產環境中的 MinIO 部署都使用多個運算和儲存裝置來建立高可用性環境。伺服器池是一組 minio server
節點,它們會將硬碟和資源集中起來,以支援物件儲存的寫入和擷取請求。
MinIO 支援將一個或多個伺服器池新增到現有的 MinIO 部署中,以進行水平擴展。當 MinIO 有多個可用的伺服器池時,個別物件始終會寫入同一個伺服器池中的同一個 erasure set。
如果一個伺服器池發生故障,MinIO 會暫停所有池的 I/O,直到叢集恢復正常運作。您必須將池恢復到可運作的狀態,才能恢復部署的 I/O。在您執行修復操作時,寫入其他池的物件在磁碟上仍然是安全的。
傳遞給 minio server
命令的 HOSTNAME
參數代表一個伺服器池。
考慮以下範例啟動命令,該命令建立一個單一伺服器池,其中包含 4 個 minio server
節點,每個節點有 4 個硬碟,總共 16 個硬碟。
minio server https://minio{1...4}.example.net/mnt/disk{1...4}
| Server Pool |
在同一個 minio server
啟動命令中啟動伺服器池,可以讓所有伺服器池對等感知。
請參閱 minio server
以取得完整的語法和用法。
MinIO 如何將多個伺服器池連結到單一 MinIO 叢集中?
叢集是指由一個或多個伺服器池組成的整個 MinIO 部署。
考慮以下命令,該命令建立一個由兩個伺服器池組成的叢集,每個池有 4 個 minio server
節點,每個節點有 4 個硬碟,總共 32 個硬碟。
minio server https://minio{1...4}.example.net/mnt/disk{1...4} \
https://minio{5...8}.example.net/mnt/disk{1...4}
| Server Pool |
每個伺服器池都有一個或多個 erasure sets,具體取決於池中的硬碟和節點數量。
MinIO 強烈建議生產叢集在伺服器池中包含至少 4 個 minio server
節點,以確保適當的高可用性和持久性。
我可以變更現有 MinIO 部署的大小嗎?
MinIO 分散式部署 支援擴展和停用功能,以增加或減少可用的儲存空間。
擴展包括將一個或多個 伺服器池 新增到現有的部署中。每個伺服器池都包含專用的節點和儲存空間,這些節點和儲存空間會為部署的整體容量做出貢獻。一旦您建立伺服器池,就無法變更其大小,但您可以隨時透過新增或停用池來新增或移除容量。
對於具有多個伺服器池的部署,您可以停用較舊的池,並將該資料遷移到部署中的較新池。一旦開始停用,就無法停止。MinIO 打算將停用用於移除具有老舊硬體的較舊池,而不是作為在任何部署中定期執行的操作。
停用然後新增時請維護池順序
如果您在多池部署中停用一個池,則不能對新池使用相同的節點順序。例如,考慮一個具有以下池的部署
https://minio-{1...4}.example.net/mnt/drive-{1...4}
https://minio-{5...8}.example.net/mnt/drive-{1...4}
https://minio-{9...12}.example.net/mnt/drive-{1...4}
如果您停用 minio-{5...8}
池,則不能新增具有相同節點編號的新池。您必須在 minio-{9...12}
之後新增新池
https://minio-{1...4}.example.net/mnt/drive-{1...4}
https://minio-{9...12}.example.net/mnt/drive-{1...4}
https://minio-{13...16}.example.net/mnt/drive-{1...4}
如何管理一個或多個 MinIO 執行個體或叢集?
有多種選項可以管理您的 MinIO 部署和叢集
個別執行個體的 MinIO Console 圖形使用者介面
如何管理 MinIO 部署中物件的分配?
MinIO 會將新物件(即沒有現有版本的物件)寫入與所有可用伺服器池上的可用空間總量相比具有最多可用空間的伺服器池,從而最佳化跨可用池的物件儲存。MinIO 不會執行將物件從較舊池重新平衡到較新池的昂貴操作。相反,新物件通常會路由到新池,因為它具有最大的可用空間。隨著該池的填滿,新的寫入操作最終會平衡到部署中的所有池。如需關於寫入偏好計算邏輯的詳細資訊,請參閱下方的 寫入檔案。
在擴展之後跨所有池重新平衡資料是一項昂貴的操作,需要掃描整個部署並在池之間移動物件。這可能需要很長時間才能完成,具體取決於要移動的資料量。
從 MinIO Client 版本 RELEASE.2022-11-07T23-47-39Z 開始,您可以使用 mc admin rebalance
,在所有伺服器池之間手動啟動重新平衡操作。
重新平衡不會封鎖正在進行的操作,並且會與所有其他 I/O 並行執行。這可能會導致正常操作的效能降低。考慮在非高峰時段排程重新平衡操作,以避免影響生產工作負載。您可以隨時開始和停止重新平衡
如何將物件上傳到 MinIO?
您可以使用任何與 S3 相容的 SDK 將物件上傳到 MinIO 部署。每個 SDK 都會執行相當於 PUT 操作的操作,該操作會將物件傳輸到 MinIO 進行儲存。
MinIO 還實作了對 多部分上傳 的支援,客戶端可以將物件分割成多個部分,以提高傳輸的輸送量和可靠性。MinIO 會重新組合這些部分,直到它有一個完整的物件,然後將該物件儲存在指定的路徑。
MinIO 如何提供可用性、冗餘和可靠性?
MinIO 使用 糾刪碼 來實現資料冗餘和可靠性
MinIO 糾刪碼是一種資料冗餘和可用性功能,允許多個硬碟的 MinIO 部署在叢集中多個硬碟或節點遺失的情況下,自動即時重建物件。相較於 RAID 或複製等相關技術,糾刪碼在物件層級提供修復,且開銷顯著較低。
MinIO 實作位元衰減修復以保護靜態資料
位元衰減是指可能發生在任何儲存裝置上隨機、靜默的資料損壞。位元衰減損壞並非由使用者的任何活動所觸發,而且系統的作業系統本身也不會意識到損壞,以通知使用者或管理員有關資料的變更。
位元衰減的一些常見原因包括
硬碟老化
電流尖峰
硬碟韌體中的錯誤
幻影寫入
錯誤導向的讀取/寫入
驅動程式錯誤
意外覆寫
MinIO 使用雜湊演算法來確認物件的完整性。此演算法會在任何物件的 GET
和 HEAD
操作時自動套用。對於版本控制儲存桶中的物件,如果 MinIO 發現版本不一致,PUT
操作也可能觸發修復。如果物件因位元衰減而損壞,MinIO 可以根據物件同位分片的可用性自動修復該物件。
MinIO 也可以使用 MinIO 掃描器 執行位元衰減檢查和修復。但是,預設情況下,掃描器位元衰減檢查是關閉的。與位元衰減影響分佈在多個硬碟和節點上的多個物件分片的低機率相比,掃描器期間的活動位元衰減修復對效能有很大的影響。正常操作期間的自動檢查通常足以應對位元衰減,MinIO 不建議使用掃描器進行此類健康檢查。
MinIO 將資料分散到糾刪集以實現高可用性和彈性
糾刪集是一組支援 MinIO 糾刪碼 的多個硬碟。糾刪碼為 MinIO 部署上儲存的資料提供高可用性、可靠性和冗餘性。
MinIO 將物件分割成稱為 分片 的區塊,並將它們均勻地分佈在糾刪集中的每個硬碟上。即使遺失任何單個硬碟,MinIO 仍可繼續無縫地處理讀取和寫入請求。在最高冗餘級別下,即使部署中總硬碟數量的一半 (\(N / 2\)) 遺失,MinIO 仍可以最小的效能影響處理讀取請求。
MinIO 會根據集合中的硬碟總數以及集合中 minio
伺服器的數量,計算伺服器池中糾刪集的大小和數量。請參閱 糾刪碼基礎知識 以取得更多資訊。
MinIO 自動即時修復損壞或遺失的資料
修復是 MinIO 在某些事件導致資料遺失後還原資料的能力。資料遺失可能來自位元衰減、硬碟遺失或節點遺失。
如果物件部分遺失,糾刪碼會提供持續的讀取和寫入存取權限。
對硬碟的獨佔存取權
MinIO 需要獨佔存取權限才能存取提供用於物件儲存的硬碟或磁碟區。其他任何處理程序、軟體、腳本或人員都不得對提供給 MinIO 的硬碟或磁碟區,或 MinIO 放置在其上的物件或檔案執行任何直接操作。
除非 MinIO 工程部門指示,否則請勿使用腳本或工具直接修改、刪除或移動所提供硬碟上的任何資料分片、同位分片或中繼資料檔案,包括從一個硬碟或節點移動到另一個硬碟或節點。此類操作很可能導致廣泛的損壞和資料遺失,超出 MinIO 的修復能力。
MinIO 使用同位在物件層級寫入資料保護
具有多個硬碟的 MinIO 部署會將可用的硬碟分為資料硬碟和同位硬碟。MinIO 糾刪碼會在寫入物件時,將關於物件內容的其他雜湊資訊新增到同位硬碟。MinIO 使用同位資訊來確認物件的完整性,並在必要時還原給定硬碟或一組硬碟上遺失、缺少或損壞的物件分片。
MinIO 可以容忍遺失的硬碟數量最多等於糾刪集中可用的同位裝置總數,同時仍提供對物件的完整存取權限。
透過仲裁提供讀寫功能
執行任務必須可用的最小硬碟數量。MinIO 有一個用於讀取資料的仲裁和一個用於寫入資料的單獨仲裁。
通常,MinIO 需要比讀取物件所需更多的可用硬碟數量,才能維持寫入物件的能力。