文件

儲存桶複製

MinIO 支援來源和目標儲存桶之間物件的伺服器端和用戶端複製。

伺服器端儲存桶複製

設定每個儲存桶的規則,以自動同步 MinIO 部署之間的物件。您在其中設定儲存桶複製規則的部署充當「來源」,而設定的遠端部署充當「目標」。MinIO 將規則應用為物件寫入操作的一部分(例如 PUT),並自動同步新物件物件變更,例如新物件版本或物件中繼資料的變更。

MinIO 伺服器端儲存桶複製僅支援遠端複製目標上相同版本的 MinIO 叢集。

用戶端儲存桶複製

使用命令程序在同一 S3 相容叢集內兩個獨立的 S3 相容叢集之間同步儲存桶之間的物件。使用 mc mirror 的用戶端複製支援 MinIO 到 S3 和類似的複製設定。

儲存桶與站點複製

儲存桶複製與 站點複製 不同且互斥。

  • 儲存桶複製在儲存桶層級同步資料,例如儲存桶前置路徑和物件。

    您可以隨時設定儲存桶複製,而且遠端 MinIO 部署可能在複製目標儲存桶上具有預先存在的資料。

  • 站點複製擴展儲存桶複製,以包含 IAM、安全性權杖、存取金鑰和儲存桶層級設定。

    站點複製通常在最初部署 MinIO 對等站點時設定。在初始設定時,只有一個站點可以擁有任何儲存桶或物件。

伺服器端儲存桶複製

MinIO 伺服器端儲存桶複製是一種自動儲存桶層級設定,可在來源和目標儲存桶之間同步物件。MinIO 伺服器端複製要求來源和目標儲存桶為兩個執行相同 MinIO 伺服器版本的獨立 MinIO 叢集。

對於每個對儲存桶的寫入操作,MinIO 會檢查儲存桶的所有已設定複製規則,並套用具有最高設定優先順序的相符規則。MinIO 會同步新物件物件變更,例如新物件版本或物件中繼資料的變更。這包括中繼資料操作,例如啟用或修改物件鎖定或保留設定。

MinIO 伺服器端儲存桶複製在功能上與 Amazon S3 複製相似,同時新增了以下僅限 MinIO 的功能

  • 來源和目標儲存桶名稱可以相同,支援站點對站點的使用案例,例如 Splunk 或 Veeam BC/DR。

  • 實作比 S3 儲存桶複寫設定更簡單,無需設定 AccessControlTranslation、Metrics 和 SourceSelectionCriteria 等設定。

  • 來源和目標儲存桶之間物件的主動-主動(雙向)複寫。

  • 三個或更多 MinIO 部署之間物件的多站點複寫。

重新同步(災難復原)

重新同步主要支援在使用複寫組態中的健全部署後,在 MinIO 部署上部分或全部遺失資料後的復原。使用 mc replicate resync 命令,完全重新同步遠端目標(mc admin bucket remote)使用指定的來源儲存桶。

重新同步程序會根據包含現有物件複寫的所有已設定複寫規則,檢查來源儲存桶中的所有物件。對於符合規則的每個物件,無論物件目前的複寫狀態為何,重新同步程序都會將該物件放入複寫佇列中。

MinIO 會略過同步那些遠端副本與來源完全符合的物件,包括物件元數據。除此之外,MinIO 不會優先處理或修改目標現有內容的佇列。

mc replicate resync 在儲存桶層級運作,並且支援前綴層級的細微性。對大型儲存桶啟動重新同步可能會導致與複寫相關的負載和流量顯著增加。請謹慎使用此命令,僅在必要時使用。

對於已設定物件轉換(分層)的儲存桶,複寫重新同步會以未轉換的狀態還原物件,且沒有相關的轉換元數據。因此,任何先前轉換到遠端儲存的資料都會永久地與遠端 MinIO 部署斷開連接。對於將明確的人類可讀取前綴指定為遠端組態一部分的分層組態,您可以安全地清除該前綴中已轉換的資料,以避免與「遺失」資料相關的成本。

刪除操作的複寫

MinIO 支援複寫刪除操作,其中 MinIO 會同步刪除特定的物件版本新的刪除標記。刪除操作複寫使用與所有其他複寫操作相同的複寫程序

MinIO 需要明確啟用版本化的刪除和刪除標記複寫。使用 mc replicate add --replicate 欄位,指定 deletedelete-marker 的其中一者或兩者,以分別啟用版本化的刪除和刪除標記複寫。若要同時啟用兩者,請使用逗號分隔符號 delete,delete-marker 指定這兩個字串。

對於刪除標記複寫,MinIO 會在刪除操作建立刪除標記後開始複寫程序。MinIO 使用 X-Minio-Replication-DeleteMarker-Status 元數據欄位來追蹤刪除標記複寫狀態。在主動-主動複寫組態中,如果兩個叢集同時為某個物件建立刪除標記,或者如果一個或兩個叢集在複寫事件同步之前已關閉,則 MinIO 可能會產生重複的刪除標記。

為了複寫特定物件版本的刪除,MinIO 會將物件版本標記為 PENDING,直到複寫完成為止。一旦遠端目標刪除該物件版本,MinIO 就會刪除來源上的物件。雖然此程序可確保近乎同步的版本刪除,但可能會導致列出操作在初始刪除操作後傳回物件版本。MinIO 使用 X-Minio-Replication-Delete-Status 來追蹤刪除版本複寫狀態。

MinIO 僅複寫明確的用戶端驅動刪除操作。MinIO 複寫從應用生命週期管理到期規則中刪除的物件。對於主動-主動組態,請在所有複寫儲存桶上設定相同的到期規則,以確保物件到期的一致應用。

現有物件的複寫

MinIO 預設會將來源儲存桶中的現有物件複寫到已設定的遠端,類似於AWS:在 S3 儲存桶之間複寫現有物件,而無需聯絡技術支援的額外負擔。

MinIO 會將符合複寫規則的所有物件或物件前綴標記為有資格同步到遠端叢集和儲存桶。MinIO 只會排除沒有版本 ID 的物件,例如在儲存桶上啟用版本控制之前寫入的那些物件。

您可以在設定或修改儲存桶複寫規則時停用現有物件複寫。您必須在建立或修改期間指定所有所需的複寫功能

  • 對於新的複寫規則,請從指定給 mc replicate add --replicate 的複寫功能清單中排除 "existing-objects"

  • 對於現有的複寫規則,使用 mc replicate update --replicate 從現有的複寫功能清單中移除 "existing-objects"。新的規則會取代先前的規則。

停用現有物件複寫不會移除任何已複寫到遠端儲存桶的物件。

同步與非同步複寫

MinIO 支援為給定的遠端目標指定非同步(預設)或同步複寫。

透過非同步複寫,MinIO 會在將物件放入複寫佇列之前完成起始的 PUT 操作。因此,起始用戶端可能會在物件複寫之前看到成功的 PUT 操作。雖然這可能會導致遠端上的物件過時或遺失,但它可以減輕因複寫負載而導致寫入操作緩慢的風險。

透過同步複寫,MinIO 會嘗試在完成起始的 PUT 操作之前複寫物件。無論複寫嘗試是否成功,MinIO 都會傳回成功的 PUT 操作。這降低了寫入操作緩慢的風險,但可能會以遠端位置上物件過時或遺失為代價。

當使用 mc admin bucket remote add 命令配置遠端目標時,您必須明確啟用同步複製,並使用 add 旗標。

複製內部機制

本節記錄了內部複製行為,對於使用或實施複製並非至關重要。此文件僅供學習和教育目的。

複製流程

MinIO 使用一個複製佇列系統,多個並行複製工作程式在此佇列上運作。MinIO 持續複製並從佇列中移除物件,同時掃描新的未複製物件以加入佇列。

在版本 RELEASE.2022-07-18T17-49-40Z 中變更:MinIO 會將失敗的複製操作放入佇列,並重試這些操作最多三次。

MinIO 會將三次嘗試後仍無法複製的複製操作從佇列中移除。掃描器可以在稍後的時間點抓取那些受影響的物件,並將它們重新放入佇列以進行複製。

在版本 RELEASE.2022-08-11T04-37-28Z 中變更:當執行列表或任何 GETHEAD API 方法時,失敗或擱置的複製會自動重新排入佇列。例如,在使用 mc statmc catmc ls 後,當遠端位置重新上線時,會重新排入複製佇列。

MinIO 根據物件的複製狀態設定 X-Amz-Replication-Status 元數據欄位

複製狀態

描述

PENDING(擱置中)

物件尚未被複製。如果物件符合儲存桶上配置的其中一項複製規則,MinIO 會應用此狀態。MinIO 持續掃描尚未在複製佇列中的 PENDING 物件,並在空間可用時將它們加入佇列。

對於多站點複製,物件會保持 PENDING 狀態,直到複製到該儲存桶或儲存桶前綴的所有已配置遠端。

COMPLETED(已完成)

物件已成功複製到遠端叢集。

FAILED(失敗)

物件複製到遠端叢集失敗。

MinIO 持續掃描尚未在複製佇列中的 FAILED 物件,並在空間可用時將它們加入佇列。

REPLICA(副本)

物件本身是來自遠端來源的副本。

複製過程通常有以下流程之一

  • PENDING -> COMPLETED

  • PENDING -> FAILED -> COMPLETED