核心操作概念
MinIO 部署的元件有哪些?
MinIO 部署包含一組儲存和運算資源,這些資源執行一個或多個 minio server
節點,這些節點共同作用為單一物件儲存庫。
MinIO 的獨立執行個體包含單一伺服器集區和單一 minio server
節點。獨立執行個體最適合用於初始開發和評估。
MinIO 部署可以直接在 裸機
或非虛擬化的基礎架構中的實體裝置上執行。或者,MinIO 可以在雲端服務上的虛擬機器內執行,例如使用 Docker、Podman 或 Kubernetes。MinIO 可以在本機、私有雲或市場上提供的任何眾多公有雲中執行。
您設計、建構和建立系統的特定方式稱為系統的 拓撲
。
MinIO 支援哪些系統拓撲?
MinIO 可以部署到三種拓撲類型:
分散式 MinIO 部署如何運作?
分散式部署會利用多個實體或虛擬機器的運算和儲存資源。在現代情況下,這通常意味著在私有或公共雲環境中執行 MinIO,例如使用 Amazon Web Services、Google Cloud Platform、Microsoft 的 Azure 平台或許多其他平台。
MinIO 如何管理多個虛擬或實體伺服器?
雖然測試 MinIO 可能只涉及單一電腦上的單一硬碟,但大多數生產環境的 MinIO 部署都會使用多個運算和儲存裝置來建立高可用性環境。伺服器池是一組 minio server
節點,這些節點會匯集其硬碟和資源,以支援物件儲存的寫入和擷取請求。
MinIO 支援將一個或多個伺服器池新增到現有的 MinIO 部署中,以進行水平擴充。當 MinIO 有多個可用的伺服器池時,個別物件始終會寫入同一伺服器池中的同一抹除集合。
如果一個伺服器池故障,MinIO 會暫停所有池的 I/O,直到叢集恢復正常運作。您必須將池恢復到正常運作狀態,才能恢復對部署的 I/O。在您執行修復操作時,寫入其他池的物件仍會安全地保留在磁碟上。
傳遞給 minio server
命令的 HOSTNAME
引數代表伺服器池。
請考慮以下啟動命令範例,該範例會建立一個具有 4 個 minio server
節點的單一伺服器池,每個節點有 4 個硬碟,總共 16 個硬碟。
minio server https://minio{1...4}.example.net/mnt/disk{1...4}
| Server Pool |
在同一個 minio server
啟動命令中啟動伺服器池,可以讓所有伺服器池對等端感知。
如需完整語法和用法,請參閱 minio server
。
MinIO 如何將多個伺服器池連結到單一 MinIO 叢集中?
叢集指的是包含一個或多個伺服器池的整個 MinIO 部署。
請考慮以下命令,該命令會建立一個由兩個伺服器池組成的叢集,每個伺服器池有 4 個 minio server
節點,每個節點有 4 個硬碟,總共 32 個硬碟。
minio server https://minio{1...4}.example.net/mnt/disk{1...4} \
https://minio{5...8}.example.net/mnt/disk{1...4}
| Server Pool |
每個伺服器池都有一個或多個 抹除集合,具體取決於池中的硬碟和節點數量。
MinIO 強烈建議生產叢集包含 至少 4 個 minio server
伺服器池中的節點,以確保適當的高可用性和耐用性。
我可以變更現有 MinIO 部署的大小嗎?
MinIO 分散式部署 支援擴充和停用功能,以增加或減少可用的儲存空間。
擴充包括將一個或多個 伺服器池 新增到現有部署中。每個伺服器池都包含專用的節點和儲存空間,這些節點和儲存空間會貢獻於部署的整體容量。建立伺服器池後,您無法變更其大小,但您可以隨時透過新增或停用池來新增或移除容量。
對於有多個伺服器池的部署,您可以停用較舊的池,並將該資料移轉到部署中較新的池。一旦開始停用,就無法停止。MinIO 打算將停用用於移除硬體老舊的舊池,而不是作為任何部署中定期執行的操作。
在停用然後新增時,請維護池順序
如果您在多池部署中停用一個池,則無法將相同的節點序列用於新池。例如,考慮一個具有以下池的部署
https://minio-{1...4}.example.net/mnt/drive-{1...4}
https://minio-{5...8}.example.net/mnt/drive-{1...4}
https://minio-{9...12}.example.net/mnt/drive-{1...4}
如果您停用 minio-{5...8}
池,則無法新增具有相同節點編號的新池。您必須在 minio-{9...12}
之後 新增新池。
https://minio-{1...4}.example.net/mnt/drive-{1...4}
https://minio-{9...12}.example.net/mnt/drive-{1...4}
https://minio-{13...16}.example.net/mnt/drive-{1...4}
如何管理一個或多個 MinIO 執行個體或叢集?
有多種選項可用於管理您的 MinIO 部署和叢集:
個別執行個體的 MinIO Console 圖形使用者介面
如何管理 MinIO 部署中的物件分佈?
MinIO 會將新物件(也就是沒有現有版本的物件)寫入可用伺服器池中,可用空間相較於所有可用伺服器池的可用空間總量來說最大的伺服器池,藉此來最佳化跨可用池的物件儲存。MinIO 不會執行將物件從較舊的池重新平衡到較新的池的昂貴操作。相反地,新物件通常會路由到新池,因為它具有最多的可用空間。隨著該池填滿,新的寫入操作最終會平衡分佈到部署中的所有池。如需有關寫入偏好計算邏輯的詳細資訊,請參閱下方寫入檔案。
在擴充後跨所有池重新平衡資料是一項昂貴的操作,需要掃描整個部署並在池之間移動物件。根據要移動的資料量,這可能需要很長時間才能完成。
從 MinIO 用戶端版本 RELEASE.2022-11-07T23-47-39Z 開始,您可以使用 mc admin rebalance
手動啟動跨所有伺服器池的重新平衡操作。
重新平衡不會封鎖正在進行的操作,並與所有其他 I/O 並行執行。這可能會導致常規操作的效能降低。請考慮在非尖峰時段安排重新平衡操作,以避免影響生產工作負載。您可以隨時開始和停止重新平衡。
如何將物件上傳到 MinIO?
您可以使用任何與 S3 相容的 SDK 將物件上傳到 MinIO 部署。每個 SDK 都會執行相當於 PUT 操作的操作,該操作會將物件傳輸到 MinIO 進行儲存。
MinIO 還實作了對 多部分上傳 的支援,用戶端可以將物件分割成多個部分,以提高傳輸的輸送量和可靠性。MinIO 會重新組裝這些部分,直到它擁有完整的物件,然後將該物件儲存在指定的路徑。
MinIO 如何提供可用性、備援性和可靠性?
MinIO 使用 錯誤更正碼 (Erasure Coding) 來實現資料冗餘和可靠性
MinIO 錯誤更正碼是一種資料冗餘和可用性功能,它允許具有多個磁碟機的 MinIO 部署,即使叢集中遺失多個磁碟機或節點,也能夠自動即時重建物件。相較於 RAID 或複寫等相關技術,錯誤更正碼提供物件層級的修復 (healing),且開銷顯著降低。
MinIO 實作位元衰減修復來保護靜態資料
位元衰減是可能在任何儲存裝置上發生的隨機、靜默的資料損毀。位元衰減損毀不是由使用者的任何活動觸發的,系統的作業系統本身也不知道損毀情況,因此不會通知使用者或管理員資料的變更。
一些位元衰減的常見原因包括:
磁碟機老化
電流尖峰
磁碟機韌體中的錯誤
幻影寫入
讀取/寫入錯誤導向
驅動程式錯誤
意外覆寫
MinIO 使用雜湊演算法來確認物件的完整性。此演算法會在物件的任何 GET
和 HEAD
操作時自動應用。對於版本化的儲存桶中的物件,如果 MinIO 偵測到版本不一致,PUT
操作也可能觸發修復。如果物件因位元衰減而損毀,MinIO 可以根據物件的同位分片 (parity shard) 的可用性,自動修復物件。
MinIO 也可以使用 MinIO 掃描器 來執行位元衰減檢查和修復。但是,掃描器的位元衰減檢查預設為關閉。在掃描器期間主動進行位元衰減修復會對效能產生很大的影響,相較之下,位元衰減影響分佈在多個磁碟機和節點的多個物件分片的機率較低。在正常操作期間的自動檢查通常足以應對位元衰減,MinIO 不建議使用掃描器進行此類健康狀況檢查。
MinIO 將資料分佈到各個錯誤更正集 (Erasure Sets),以實現高可用性和彈性
錯誤更正集是一組支援 MinIO 錯誤更正碼的多個磁碟機。錯誤更正碼提供 MinIO 部署上儲存資料的高可用性、可靠性和冗餘。
MinIO 將物件分成稱為 分片 (shard) 的區塊,並將它們均勻地分佈在錯誤更正集中的每個磁碟機上。即使遺失任何單個磁碟機,MinIO 也能夠繼續無縫地提供讀取和寫入請求。在最高冗餘級別下,即使部署中遺失的磁碟機總數達到一半 (\(N / 2\)),MinIO 仍可以以最小的效能影響提供讀取請求。
MinIO 會根據集合中磁碟機的總數以及集合中 minio
伺服器的數量,計算伺服器集區中錯誤更正集的大小和數量。有關更多資訊,請參閱 錯誤更正碼基礎。
MinIO 自動即時修復損壞或遺失的資料
修復是 MinIO 在某些事件導致資料遺失後還原資料的能力。資料遺失可能來自位元衰減、磁碟機遺失或節點遺失。
如果物件部分遺失,錯誤更正碼可以持續提供讀取和寫入存取。
磁碟機的獨佔存取權
MinIO 需要對提供用於物件儲存的磁碟機或磁碟區進行獨佔存取。其他程序、軟體、腳本或人員不應直接對提供給 MinIO 的磁碟機或磁碟區或 MinIO 放置在上面的物件或檔案執行任何操作。
除非 MinIO 工程部門指示,否則請勿使用腳本或工具直接修改、刪除或移動所提供磁碟機上的任何資料分片、同位分片或中繼資料檔案,包括從一個磁碟機或節點移動到另一個磁碟機或節點。此類操作非常有可能導致廣泛的損毀和資料遺失,超出 MinIO 的修復能力。
MinIO 使用同位在物件層級寫入資料保護
具有多個磁碟機的 MinIO 部署會將可用的磁碟機分為資料磁碟機和同位磁碟機。MinIO 錯誤更正碼在寫入物件時,會將有關物件內容的其他雜湊資訊新增到同位磁碟機。MinIO 使用同位資訊來確認物件的完整性,並在必要時還原給定磁碟機或一組磁碟機上遺失、丟失或損壞的物件分片。
MinIO 可以容許遺失的磁碟機總數等於錯誤更正集中可用的同位裝置數量,同時仍提供對物件的完整存取權。
使用仲裁交付讀取和寫入功能
執行任務時必須可用的最小磁碟機數量。MinIO 有一個用於讀取資料的仲裁,以及一個用於寫入資料的單獨仲裁。
通常,MinIO 需要比讀取物件所需數量更多的可用磁碟機數量,才能維持寫入物件的能力。