使用 InfluxDB 進行監控和警報
MinIO 使用 Prometheus 資料模型 發佈叢集和節點指標。 InfluxDB 支援抓取 MinIO 指標資料以進行監控和警報。
此頁面上的程序說明以下內容
設定 InfluxDB 服務以抓取和顯示來自 MinIO 部署的指標
在 MinIO 指標上設定警報
先決條件
此程序需要以下內容
設定 InfluxDB 以使用 MinIO 指標收集和警報
重要
此程序特別使用 InfluxDB UI 來建立抓取端點。
InfluxDB UI 並未提供與使用 Telegraf 和相應的 Prometheus 外掛程式相同等級的設定。具體來說
您無法透過 InfluxDB UI 啟用對 MinIO 指標端點的驗證存取
您無法為收集的指標設定標籤 (例如
url_tag
) 以唯一識別給定 MinIO 部署的指標
設定 Telegraf 超出此程序的範圍。您可以將此程序用作設定 Telegraf 以抓取 MinIO 指標的一般指南。
設定對 MinIO 指標的公開存取
將
MINIO_PROMETHEUS_AUTH_TYPE
環境變數設定為 MinIO 部署中所有節點的"public"
。然後您可以重新啟動部署以允許公開存取 MinIO 指標。您可以嘗試使用
curl
命令來驗證變更是否生效,以檢視指標端點。curl https://HOSTNAME/minio/v2/metrics/cluster
將
HOSTNAME
替換為您用來存取 MinIO 部署的負載平衡器或反向代理的 URL。您也可以指定任何單一節點為HOSTNAME:PORT
,其中PORT
除了節點主機名稱之外,還需指定 MinIO 伺服器 API 連接埠。回應主體應包含收集到的 MinIO 指標列表。
登入 InfluxDB UI 並建立一個 Bucket(儲存桶)
選擇您要用來儲存 MinIO 指標的 組織。
建立一個 新的儲存桶 (Bucket),用於儲存 MinIO 部署的指標。
建立新的 Scraping Source (抓取來源)
建立一個 新的 InfluxDB 抓取器。
指定 MinIO 部署的完整 URL,包括指標端點。
https://HOSTNAME/minio/v2/metrics/cluster
將
HOSTNAME
替換為您用來存取 MinIO 部署的負載平衡器或反向代理的 URL。您也可以指定任何單一節點為HOSTNAME:PORT
,其中PORT
除了節點主機名稱之外,還需指定 MinIO 伺服器 API 連接埠。驗證資料
使用 DataExplorer 來視覺化收集到的 MinIO 資料。
例如,您可以針對
minio_cluster_capacity_usable_total_bytes
和minio_cluster_capacity_usable_free_bytes
設定篩選器,以比較 MinIO 部署上的可用總空間與可用剩餘空間。設定檢查
針對 MinIO 指標建立一個新的檢查。
以下範例檢查規則提供 MinIO 部署的警示基準。您可以修改或使用這些範例,以指導您建立自己的檢查。
建立一個名為
MINIO_NODE_DOWN
的 閾值檢查。為
minio_cluster_nodes_offline_total
鍵設定篩選器。將 閾值 設定為當數值大於 1 時 警告。
建立一個名為
MINIO_QUORUM_WARNING
的 閾值檢查。為
minio_cluster_drive_offline_total
鍵設定篩選器。當數值比您設定的Erasure Code Parity(糾刪碼同位) 設定少一時,將閾值 設定為 嚴重。
例如,使用 EC:4 的部署應將此值設定為
3
。