使用 InfluxDB 進行監控和警報
MinIO 使用 Prometheus 資料模型發佈叢集和節點度量。 InfluxDB 支援抓取 MinIO 度量數據以進行監控和警報。
本頁的程序記錄了以下內容
設定 InfluxDB 服務以抓取和顯示來自 MinIO 部署的度量
在 MinIO 度量上設定警報
先決條件
此程序需要以下內容
設定 InfluxDB 以使用 MinIO 度量收集和警報
重要
此程序特別使用 InfluxDB UI 來建立抓取端點。
InfluxDB UI 沒有提供與使用Telegraf 和對應的Prometheus 外掛程式相同的設定層級。具體來說
您無法透過 InfluxDB UI 啟用對 MinIO 度量端點的驗證存取
您無法為收集的度量設定標籤(例如
url_tag
),以唯一識別給定 MinIO 部署的度量
設定 Telegraf 超出了此程序的範圍。您可以使用此程序作為設定 Telegraf 以抓取 MinIO 度量的通用指南。
設定對 MinIO 度量的公開存取
將 MinIO 部署中所有節點的
MINIO_PROMETHEUS_AUTH_TYPE
環境變數設定為"public"
。然後您可以重新啟動部署,以允許對 MinIO 度量進行公開存取。您可以嘗試
curl
度量端點來驗證變更curl https://HOSTNAME/minio/v2/metrics/cluster
將
HOSTNAME
替換為您存取 MinIO 部署的負載平衡器或反向代理的 URL。您也可以指定任何單個節點為HOSTNAME:PORT
,除了節點主機名稱之外,還指定 MinIO 伺服器 API 連接埠。回應主體應包含收集的 MinIO 度量列表。
登入 InfluxDB UI 並建立儲存桶
選取您要在其中儲存 MinIO 度量的組織。
建立一個新儲存桶,用於儲存 MinIO 部署的度量。
建立新的抓取來源
指定 MinIO 部署的完整 URL,包括度量端點
https://HOSTNAME/minio/v2/metrics/cluster
將
HOSTNAME
替換為您存取 MinIO 部署的負載平衡器或反向代理的 URL。您也可以指定任何單個節點為HOSTNAME:PORT
,除了節點主機名稱之外,還指定 MinIO 伺服器 API 連接埠。驗證資料
使用DataExplorer 來視覺化收集的 MinIO 資料。
例如,您可以在
minio_cluster_capacity_usable_total_bytes
和minio_cluster_capacity_usable_free_bytes
上設定篩選器,以比較 MinIO 部署上的總可用空間和總可用可用空間。設定檢查
在 MinIO 度量上建立新的檢查。
以下範例檢查規則提供 MinIO 部署的警示基準。您可以修改或以其他方式使用這些範例,作為建立您自己的檢查的指南。
建立一個名為
MINIO_NODE_DOWN
的 閾值檢查。設定
minio_cluster_nodes_offline_total
鍵的篩選器。將 閾值 設定為當值大於 1 時發出 警告
建立一個名為
MINIO_QUORUM_WARNING
的 閾值檢查。設定
minio_cluster_drive_offline_total
鍵的篩選器。將 閾值 設定為當值比您設定的Erasure Code Parity (抹除碼同位) 設定少一時發出 嚴重 警示。
例如,使用 EC:4 的部署應將此值設定為
3
。