文件

使用 InfluxDB 進行監控和警報

MinIO 使用 Prometheus 資料模型發佈叢集和節點度量。 InfluxDB 支援抓取 MinIO 度量數據以進行監控和警報。

本頁的程序記錄了以下內容

  • 設定 InfluxDB 服務以抓取和顯示來自 MinIO 部署的度量

  • 在 MinIO 度量上設定警報

先決條件

此程序需要以下內容

  • 已設定一個或多個通知端點的現有 InfluxDB 部署

  • 具有網路存取 InfluxDB 部署的現有 MinIO 部署

  • 在您的本機主機上安裝 mc,並設定為存取 MinIO 部署

設定 InfluxDB 以使用 MinIO 度量收集和警報

重要

此程序特別使用 InfluxDB UI 來建立抓取端點。

InfluxDB UI 沒有提供與使用Telegraf 和對應的Prometheus 外掛程式相同的設定層級。具體來說

  • 您無法透過 InfluxDB UI 啟用對 MinIO 度量端點的驗證存取

  • 您無法為收集的度量設定標籤(例如 url_tag),以唯一識別給定 MinIO 部署的度量

設定 Telegraf 超出了此程序的範圍。您可以使用此程序作為設定 Telegraf 以抓取 MinIO 度量的通用指南。

  1. 設定對 MinIO 度量的公開存取

    將 MinIO 部署中所有節點的 MINIO_PROMETHEUS_AUTH_TYPE 環境變數設定為 "public"。然後您可以重新啟動部署,以允許對 MinIO 度量進行公開存取。

    您可以嘗試 curl 度量端點來驗證變更

    curl https://HOSTNAME/minio/v2/metrics/cluster
    

    HOSTNAME 替換為您存取 MinIO 部署的負載平衡器或反向代理的 URL。您也可以指定任何單個節點為 HOSTNAME:PORT,除了節點主機名稱之外,還指定 MinIO 伺服器 API 連接埠。

    回應主體應包含收集的 MinIO 度量列表。

  2. 登入 InfluxDB UI 並建立儲存桶

    選取您要在其中儲存 MinIO 度量的組織

    建立一個新儲存桶,用於儲存 MinIO 部署的度量。

  3. 建立新的抓取來源

    建立新的 InfluxDB 抓取器

    指定 MinIO 部署的完整 URL,包括度量端點

    https://HOSTNAME/minio/v2/metrics/cluster
    

    HOSTNAME 替換為您存取 MinIO 部署的負載平衡器或反向代理的 URL。您也可以指定任何單個節點為 HOSTNAME:PORT,除了節點主機名稱之外,還指定 MinIO 伺服器 API 連接埠。

  4. 驗證資料

    使用DataExplorer 來視覺化收集的 MinIO 資料。

    例如,您可以在 minio_cluster_capacity_usable_total_bytesminio_cluster_capacity_usable_free_bytes 上設定篩選器,以比較 MinIO 部署上的總可用空間和總可用可用空間。

  5. 設定檢查

    在 MinIO 度量上建立新的檢查

    以下範例檢查規則提供 MinIO 部署的警示基準。您可以修改或以其他方式使用這些範例,作為建立您自己的檢查的指南。

    • 建立一個名為 MINIO_NODE_DOWN閾值檢查

      設定 minio_cluster_nodes_offline_total 鍵的篩選器。

      閾值 設定為當值大於 1 時發出 警告

    • 建立一個名為 MINIO_QUORUM_WARNING閾值檢查

      設定 minio_cluster_drive_offline_total 鍵的篩選器。

      閾值 設定為當值比您設定的Erasure Code Parity (抹除碼同位) 設定少一時發出 嚴重 警示。

      例如,使用 EC:4 的部署應將此值設定為 3

    設定您的通知端點通知規則,以便每種類型的檢查都會觸發適當的回應。