文件

核心操作概念

MinIO 部署的組成元件有哪些?

MinIO 部署包含一組儲存和計算資源,這些資源執行一個或多個 minio server 節點,這些節點共同充當單一物件儲存存放庫。

MinIO 的獨立執行個體包含單一伺服器集區和單一 minio server 節點。獨立執行個體最適合用於初始開發和評估。

MinIO 部署可以直接在 裸機 或非虛擬化基礎架構中的實體裝置上執行。或者,MinIO 也可能在雲端服務上的虛擬機器中執行,例如使用 Docker、Podman 或 Kubernetes。MinIO 可以在本機、私有雲或市場上眾多可用的公有雲中的任何一個雲端中執行。

您設計、架構和建置系統的特定方式稱為系統的 拓撲

MinIO 支援哪些系統拓撲?

MinIO 可以部署到三種類型的拓撲

  1. 單節點單磁碟機,一個 MinIO 伺服器,具有單一磁碟機或資料夾來儲存資料

    例如,在本地 PC 上使用電腦硬碟上的資料夾進行測試。

  2. 單節點多磁碟機,一個 MinIO 伺服器,具有多個掛載的磁碟機或資料夾來儲存資料

    例如,具有兩個或多個掛載磁碟區的單一容器。

  3. 多節點多磁碟機,多個 MinIO 伺服器,具有多個掛載的磁碟機或磁碟區來儲存資料

    例如,使用 Kubernetes 來管理和部署 Pod 及其相關的持續性磁碟區宣告的生產部署。

分散式 MinIO 部署如何運作?

分散式部署會利用多個實體或虛擬機器的運算和儲存資源。在現代情況下,這通常意味著在私有或公有雲環境中運行 MinIO,例如使用 Amazon Web Services、Google Cloud Platform、Microsoft 的 Azure 平台或許多其他平台。

MinIO 如何管理多個虛擬或實體伺服器?

雖然測試 MinIO 可能只涉及單一電腦上的單一磁碟機,但大多數生產環境的 MinIO 部署會使用多個運算和儲存裝置來建立高可用性環境。伺服器池是一組 minio server 節點,這些節點會匯集其磁碟機和資源,以支援物件儲存的寫入和擷取請求。

MinIO 支援將一個或多個伺服器池新增到現有的 MinIO 部署中,以進行水平擴展。當 MinIO 有多個可用的伺服器池時,單個物件始終會寫入同一個伺服器池中的同一個糾刪集。

如果一個伺服器池關閉,MinIO 會停止所有池的 I/O,直到叢集恢復正常運作。您必須將池恢復到可運作狀態,才能恢復對部署的 I/O。在您執行修復操作時,寫入其他池的物件會安全地保存在磁碟上。

傳遞給 minio server 命令的 HOSTNAME 引數代表一個伺服器池。

請考慮以下範例啟動命令,該命令建立一個包含 4 個 minio server 節點的單一伺服器池,每個節點有 4 個磁碟機,總共 16 個磁碟機。

minio server https://minio{1...4}.example.net/mnt/disk{1...4}

             |                    Server Pool                |

在同一個 minio server 啟動命令中啟動伺服器池,可以讓所有伺服器池對等點都知道彼此。

如需完整的語法和用法,請參閱 minio server

我可以變更現有 MinIO 部署的大小嗎?

MinIO 分散式部署 支援擴展和停用功能,以增加或減少可用的儲存空間。

擴展包括將一個或多個 伺服器池 新增到現有的部署中。每個伺服器池都包含專用的節點和儲存空間,這些節點和儲存空間有助於提高部署的整體容量。建立伺服器池後,您無法變更其大小,但您可以隨時新增或停用池來新增或移除容量。

如需更多資訊,請參閱 擴展 MinIO 租戶

對於具有多個伺服器池的部署,您可以停用較舊的池,並將該資料遷移到部署中較新的池。一旦開始停用,就無法停止。MinIO 打算將停用用於移除具有老舊硬體的較舊池,而不是作為在任何部署中定期執行的操作。

在停用然後新增時,請保持池的順序。

如果您在多池部署中停用一個池,則無法對新池使用相同的節點順序。例如,請考慮具有以下池的部署

https://minio-{1...4}.example.net/mnt/drive-{1...4}
https://minio-{5...8}.example.net/mnt/drive-{1...4}
https://minio-{9...12}.example.net/mnt/drive-{1...4}

如果您停用 minio-{5...8} 池,則無法新增具有相同節點編號的新池。您必須在 minio-{9...12} 之後新增新池

https://minio-{1...4}.example.net/mnt/drive-{1...4}
https://minio-{9...12}.example.net/mnt/drive-{1...4}
https://minio-{13...16}.example.net/mnt/drive-{1...4}

我如何管理一個或多個 MinIO 執行個體或叢集?

有多種選項可以管理您的 MinIO 部署和叢集

我如何管理 MinIO 部署中物件的分配?

MinIO 會將新物件(也就是沒有現有版本的物件)寫入所有可用伺服器池的可用空間總量相比之下,可用空間最多的伺服器池,以此來最佳化跨可用池的物件儲存。MinIO 不會執行將物件從較舊的池重新平衡到較新的池的昂貴動作。相反地,新物件通常會路由到具有最大可用空間的新池。隨著該池被填滿,新的寫入操作最終會在部署中的所有池之間達到平衡。如需有關寫入偏好計算邏輯的更多資訊,請參閱下方的寫入檔案

擴展後重新平衡所有池中的資料是一項昂貴的操作,需要掃描整個部署並在池之間移動物件。這可能需要很長時間才能完成,具體取決於要移動的資料量。

從 MinIO Client 版本 RELEASE.2022-11-07T23-47-39Z 開始,您可以使用 mc admin rebalance 手動啟動跨所有伺服器池的重新平衡操作。

重新平衡不會封鎖正在進行的操作,並且會與所有其他 I/O 並行執行。這可能會導致一般操作的效能降低。請考慮在非高峰期間排程重新平衡操作,以避免影響生產工作負載。您可以隨時開始和停止重新平衡

我如何將物件上傳到 MinIO?

您可以使用任何與 S3 相容的 SDK 將物件上傳到 MinIO 部署。每個 SDK 執行相當於 PUT 操作的操作,該操作會將物件傳輸到 MinIO 進行儲存。

MinIO 也實作了對 多部分上傳 的支援,其中用戶端可以將物件分割成多個部分,以提高傳輸的輸送量和可靠性。MinIO 會重新組裝這些部分,直到它擁有一個完整的物件,然後將該物件儲存在指定的路徑。

MinIO 如何提供可用性、冗餘和可靠性?

MinIO 使用糾刪碼來實現資料冗餘和可靠性

MinIO 糾刪碼是一種資料冗餘和可用性功能,可讓具有多個磁碟機的 MinIO 部署在叢集中遺失多個磁碟機或節點的情況下,自動即時重建物件。與 RAID 或複寫等鄰近技術相比,糾刪碼提供物件層級的 修復,且額外負荷明顯較低。

MinIO 實作位元腐爛修復來保護靜態資料

位元腐爛是隨機的、靜態的資料損壞,可能會發生在任何儲存裝置上。位元腐爛損壞不是由使用者的任何活動引起的,系統的作業系統本身也不知道損壞情況,無法通知使用者或管理員資料的變更。

位元腐爛的一些常見原因包括

  • 老化的磁碟機

  • 電流尖峰

  • 磁碟機韌體中的錯誤

  • 虛幻寫入

  • 讀取/寫入方向錯誤

  • 驅動程式錯誤

  • 意外覆寫

MinIO 使用雜湊演算法來確認物件的完整性。此演算法會在針對物件的任何 GETHEAD 操作時自動套用。對於版本控制儲存貯體中的物件,如果 MinIO 識別出版本不一致,PUT 操作也可能會觸發修復。如果物件因位元腐爛而損壞,MinIO 可以根據物件同位區塊的可用性自動修復該物件。

MinIO 也可以使用 MinIO 掃描器 執行位元腐爛檢查和修復。但是,依預設,掃描器位元腐爛檢查是關閉的。與位元腐爛影響分佈在多個磁碟機和節點上的多個物件分片的低機率相比,掃描器期間的主動位元腐爛修復具有很高的效能影響。正常操作期間的自動檢查通常足以應對位元腐爛,MinIO 不建議使用掃描器進行此類健康情況檢查。

MinIO 將資料分散到 Erasure Sets(抹除集) 中,以實現高可用性和彈性

抹除集 (Erasure Set) 是一組支援 MinIO Erasure Coding (抹除編碼) 的多個磁碟機。 抹除編碼為儲存在 MinIO 部署上的資料提供高可用性、可靠性和冗餘性。

MinIO 將物件分割成稱為 分片 (shards) 的區塊,並將它們平均分散到抹除集中的每個磁碟機上。 即使遺失任何單一磁碟機,MinIO 仍可繼續無縫地服務讀取和寫入請求。 在最高的冗餘級別下,即使部署中最多一半 (\(N / 2\)) 的磁碟機遺失,MinIO 仍可以最小的效能影響來服務讀取請求。

MinIO 會根據集合中磁碟機的總數以及集合中 minio 伺服器的數量來計算伺服器池中抹除集的大小和數量。 有關更多信息,請參閱 抹除編碼基礎知識

MinIO 會即時自動修復損壞或遺失的資料

修復 (Healing) 是 MinIO 在發生某些導致資料遺失的事件後恢復資料的能力。 資料遺失可能來自位元錯誤、磁碟機遺失或節點遺失。

如果物件部分遺失,抹除編碼 可持續提供讀取和寫入存取權限。

磁碟機的獨佔存取權

MinIO 要求 獨佔 存取提供用於物件儲存的磁碟機或磁碟區。 不應有其他程序、軟體、腳本或人員直接對提供給 MinIO 的磁碟機或磁碟區,或 MinIO 放置在其上的物件或檔案執行任何動作。

除非 MinIO 工程部門指示,否則請勿使用腳本或工具直接修改、刪除或移動所提供磁碟機上的任何資料分片、同位分片或中繼資料檔案,包括從一個磁碟機或節點移動到另一個磁碟機或節點。 此類操作很可能會導致廣泛的損壞和資料遺失,超出 MinIO 的修復能力。

MinIO 使用同位 (Parity) 在物件層級寫入資料保護

具有多個磁碟機的 MinIO 部署會將可用的磁碟機劃分為資料磁碟機和同位磁碟機。 當寫入物件時,MinIO 抹除編碼會將有關物件內容的其他雜湊資訊新增至同位磁碟機。 MinIO 使用同位資訊來確認物件的完整性,並在必要時還原給定磁碟機或一組磁碟機上遺失、遺漏或損壞的物件分片。

MinIO 可以容忍遺失的磁碟機總數等於抹除集中可用的同位裝置數量,同時仍然提供對物件的完全存取權。

使用法定人數提供讀取和寫入功能

執行任務必須可用的最少磁碟機數量。 MinIO 有一個用於讀取資料的法定人數和一個用於寫入資料的獨立法定人數。

通常,MinIO 需要較多的可用磁碟機來維持寫入物件的能力,而不是讀取物件所需的能力。