儲存桶複製
MinIO 支援來源和目標儲存桶之間的伺服器端和用戶端物件複製。
- 伺服器端儲存桶複製
設定每個儲存桶的規則,以自動同步 MinIO 部署之間的物件。您在其中設定儲存桶複製規則的部署充當「來源」,而設定的遠端部署充當「目標」。MinIO 將規則應用為物件寫入操作(例如,
PUT
)的一部分,並自動同步新物件和物件變更,例如新的物件版本或對物件中繼資料的變更。MinIO 伺服器端儲存桶複製僅支援在遠端複製目標上使用相同版本的 MinIO 叢集。
- 用戶端儲存桶複製
使用命令程序來同步同一 S3 相容叢集內或兩個獨立 S3 相容叢集之間的儲存桶之間的物件。使用
mc mirror
的用戶端複製支援 MinIO 到 S3 和類似的複製組態。
儲存桶與站點複製
儲存桶複製與站點複製不同且互斥。
儲存桶複製會在儲存桶層級同步資料,例如儲存桶首碼路徑和物件。
您可以隨時設定儲存桶複製,而遠端 MinIO 部署可能在複製目標儲存桶上具有預先存在的資料。
站點複製將儲存桶複製擴展到包括IAM、安全權杖、存取金鑰和儲存桶層級組態。
站點複製通常在最初部署 MinIO 對等站點時設定。在初始設定時,只有一個站點可以保存任何儲存桶或物件。
伺服器端儲存桶複製
MinIO 伺服器端儲存桶複製是一種自動儲存桶層級組態,可在來源和目標儲存桶之間同步物件。MinIO 伺服器端複製要求來源和目標儲存桶是兩個執行相同 MinIO Server 版本的獨立 MinIO 叢集。
對於每個對儲存桶的寫入操作,MinIO 都會檢查儲存桶的所有已設定複製規則,並套用具有最高設定優先順序的相符規則。MinIO 同步新物件和物件變更,例如新的物件版本或對物件中繼資料的變更。這包括中繼資料操作,例如啟用或修改物件鎖定或保留設定。
MinIO 伺服器端儲存桶複製的功能類似於 Amazon S3 複製,同時新增以下僅限 MinIO 的功能
來源和目標儲存桶名稱可以相符,支援站點到站點的使用案例,例如 Splunk 或 Veeam BC/DR。
與 S3 儲存桶複製設定相比,實作更簡單,無需設定 AccessControlTranslation、Metrics 和 SourceSelectionCriteria 等設定。
來源和目標儲存桶之間的物件主動-主動(雙向)複製。
三個或多個 MinIO 部署之間的物件多站點複製
重新同步(災難復原)
重新同步主要支援在複本配置中使用健康的部署,從 MinIO 部署上的部分或全部資料遺失中恢復。使用 mc replicate resync
命令,使用指定的來源儲存桶完全重新同步遠端目標(mc admin bucket remote
)。
重新同步程序會針對所有包含現有物件複寫的已設定複寫規則,檢查來源儲存桶中的所有物件。對於每個符合規則的物件,無論物件目前的複寫狀態為何,重新同步程序都會將物件放入複寫佇列中。
MinIO 會略過同步處理那些遠端副本與來源完全匹配的物件,包括物件中繼資料。否則,MinIO 不會針對目標的現有內容設定佇列的優先順序或修改佇列。
mc replicate resync
在儲存桶層級運作,並且不支援前綴層級的粒度。在大型儲存桶上啟動重新同步可能會導致複寫相關負載和流量顯著增加。請謹慎使用此命令,且僅在必要時使用。
對於已設定物件轉換(分層)的儲存桶,複寫重新同步會以未轉換狀態復原物件,且不帶任何相關的轉換中繼資料。因此,先前轉換到遠端儲存空間的任何資料都會永久與遠端 MinIO 部署斷開連線。對於將明確的人類可讀前綴指定為遠端配置一部分的分層配置,您可以安全地清除該前綴中已轉換的資料,以避免與「遺失」資料相關聯的成本。
刪除作業的複寫
MinIO 支援複寫刪除作業,其中 MinIO 會同步刪除特定物件版本和新的刪除標記。刪除作業複寫使用與所有其他複寫作業相同的複寫程序。
MinIO 需要明確啟用版本化的刪除和刪除標記複寫。使用 mc replicate add --replicate
欄位來指定 delete
和 delete-marker
的其中一項或兩者,以分別啟用版本化的刪除和刪除標記複寫。若要同時啟用兩者,請使用逗號分隔符號 delete,delete-marker
來指定兩個字串。
對於刪除標記複寫,MinIO 會在刪除作業建立刪除標記後開始複寫程序。MinIO 使用 X-Minio-Replication-DeleteMarker-Status
中繼資料欄位來追蹤刪除標記複寫狀態。在主動-主動複寫配置中,如果兩個叢集同時為物件建立刪除標記,或如果一個或兩個叢集在複寫事件同步之前已關閉,MinIO 可能會產生重複的刪除標記。
為了複寫特定物件版本的刪除,MinIO 會將該物件版本標記為 PENDING
,直到複寫完成為止。一旦遠端目標刪除該物件版本,MinIO 就會刪除來源上的物件。雖然此程序可確保近乎同步的版本刪除,但可能會導致在初始刪除作業之後,清單作業傳回物件版本。MinIO 使用 X-Minio-Replication-Delete-Status
來追蹤刪除版本複寫狀態。
MinIO 僅複寫明確的用戶端驅動刪除作業。MinIO 不複寫從應用生命週期管理到期規則刪除的物件。對於主動-主動配置,請在所有複寫儲存桶上設定相同的到期規則,以確保物件到期的一致應用。
MinIO 會在來源和遠端儲存桶上修剪空的物件前綴
如果刪除作業移除儲存桶前綴中的最後一個物件,MinIO 會以遞迴方式移除前綴的每個空部分,直到儲存桶根目錄為止。MinIO 僅將遞迴移除套用到作為物件寫入作業的一部分隱含建立的前綴,也就是說,前綴不是使用明確的目錄建立命令(例如 mc mb
)建立的。
如果複寫規則啟用複寫刪除作業,則複寫程序也會將隱含前綴修剪行為套用到目的地 MinIO 叢集。
例如,考慮具有以下物件前綴的儲存桶 photos
photos/2021/january/myphoto.jpg
photos/2021/february/myotherphoto.jpg
photos/NYE21/NewYears.jpg
photos/NYE21
是唯一使用 mc mb
明確建立的前綴。所有其他前綴都是作為寫入位於該前綴的物件的一部分隱含建立的。
命令移除
myphoto.jpg
。MinIO 會自動修剪空的/janaury
前綴。然後,命令會移除
myotherphoto.jpg
。MinIO 會自動修剪/february
前綴和現在為空的/2021
前綴。命令會移除
NewYears.jpg
物件。MinIO 會讓/NYE21
前綴保持原位,因為它是明確建立的。
現有物件的複寫
預設情況下,MinIO 會將來源儲存桶中的現有物件複寫到已設定的遠端,類似於AWS:在 S3 儲存桶之間複寫現有物件,而無需聯繫技術支援的負擔。
MinIO 會將所有符合複寫規則的物件或物件前綴標記為符合與遠端叢集和儲存桶同步的條件。MinIO 只會排除那些沒有版本 ID 的物件,例如在儲存桶上啟用版本控制之前寫入的物件。
您可以在設定或修改儲存桶複寫規則時停用現有物件複寫。您必須在建立或修改期間指定所有所需的複寫功能
對於新的複寫規則,請從指定給
mc replicate add --replicate
的複寫功能清單中排除"existing-objects"
。對於現有的複寫規則,請使用
mc replicate update --replicate
,從現有複寫功能清單中移除"existing-objects"
。新規則會取代先前的規則。
停用現有物件複寫不會移除已複寫到遠端儲存桶的任何物件。
同步與非同步複寫
MinIO 支援為給定的遠端目標指定非同步(預設)或同步複寫。
使用非同步複寫,MinIO 會在將物件放入複寫佇列之前完成原始的 PUT
作業。因此,原始用戶端可能會在複寫物件之前看到成功的 PUT
作業。雖然這可能會導致遠端上的物件過時或遺失,但它可以降低因複寫負載而導致寫入作業速度變慢的風險。
使用同步複寫,MinIO 會在完成原始的 PUT
作業之前嘗試複寫物件。無論複寫嘗試是否成功,MinIO 都會傳回成功的 PUT
作業。這會降低寫入作業速度變慢的風險,但可能會以遠端位置的物件過時或遺失為代價。
使用帶有 add
旗標的 mc admin bucket remote add
命令設定遠端目標時,您必須明確啟用同步複寫。
複寫內部機制
本節說明內部複寫行為,對於使用或實作複寫並非至關重要。此文件僅供學習和教育之用。
複寫程序
MinIO 使用複寫佇列系統,多個並行複寫工作程式在該佇列上運作。MinIO 會不斷努力從佇列中複寫和移除物件,同時掃描要新增到佇列的新未複寫物件。
在 RELEASE.2022-07-18T17-49-40Z 版本中變更:MinIO 會將失敗的複寫作業排入佇列,並重試這些作業最多三 (3) 次。
MinIO 會將在三次嘗試後仍無法複寫的複寫作業取消排隊。掃描器可以在稍後的時間擷取受影響的物件,並將其重新排入複寫佇列。
版本變更於 RELEASE.2022-08-11T04-37-28Z:當執行列表或任何 GET
或 HEAD
API 方法時,失敗或待處理的複寫會自動重新排隊。例如,在遠端位置恢復連線後,使用 mc stat
、mc cat
或 mc ls
會重新排隊進行複寫。
MinIO 會根據物件的複寫狀態設定 X-Amz-Replication-Status
的中繼資料欄位
複寫狀態 |
描述 |
---|---|
|
物件尚未被複寫。如果物件符合儲存桶上已設定的複寫規則之一,MinIO 會套用此狀態。MinIO 會持續掃描尚未在複寫佇列中的 對於多站點複寫,物件會保持 |
|
物件已成功複寫到遠端叢集。 |
|
物件複寫到遠端叢集失敗。 MinIO 會持續掃描尚未在複寫佇列中的 |
|
物件本身是來自遠端來源的複本。 |
複寫過程通常具有以下流程之一
PENDING -> COMPLETED
PENDING -> FAILED -> COMPLETED