《關於我怎麼把一年內學到的新手 IT/SRE 濃縮到 30 天筆記這檔事》 Day 25 Grafana - 視覺化和分析工具

本篇大綱

今天要巡一下 Grafana 可以設定哪些東西?裡面又有哪些內容,今天就來帶各位看看!

內文

上一篇設定好 Grafana VirtualService 還有 Prometheus 設定,今天就來跟大家一起看有哪些內容

day25-01.png

左側選單欄就可以看一些端睨

day25-02.png

其中幾個選項需要講一講:

  • Dashboards:就是放視覺化圖的地方,除了一般的 Dashboard 觀看以外,還有電視 TV 功能輪流播放,匯入別人寫好的儀表板。
  • Explore:中文叫做探索,意思就是可以讓你實驗 Datasource 的地方。
  • Alerting:警告設定的地方,預設會使用 Grafana 的 Alert,你也可以改成 Prometheus 的 Alertmanager。
  • Configuration:設定資料來源 (Datasource)、使用者、組別 (Teams)、偏好設定、Service Accounts。
  • Server admin:這裡就是管理員的地方了,可以自由新增使用者跟組織 (Orgs)。

Dashboards

點進去到 Dashboards > Browse

day25-03.png

點進去 Kubernetes / Compute Resources / Cluster 就會有 CPU

day25-04.png

往下拉就會有 Memory 資料、網路、Storage 讀寫速度

day25-05.png

這些都是 kube-prometheus-stack 預先加入進去的圖表,就可以根據你的需求去做調整。

官方也開放讓大家投稿好用的 Dashboard,可以丟上去:https://grafana.com/grafana/dashboards/

看到不錯的圖表可以 Copy ID 到你的 Import 裡面

day25-06.png

輸入 ID 進去或者 Import JSON 進去

day25-07.png

選好要放在哪裡,採用哪個 Datasource,就可以按下 Import

day25-08.png

就可以看到新加入的 Dashboard 囉!

day25-09.png

Explore

Explore 就是可以去測試 Grafana 傳給 PromQL 回傳的顯示資料

day25-10.png

Alerting

這裡的 Alerting 是 Grafana 自己的 Alerting,並非是 Prometheus 的 Alertmanager。

可以在 Alerting > Contact points 新增提醒的訊息,系統支援很多傳送,包含 LINE、Discord、Telegram、PagerDuty 等平台。

day25-11.png

這個範例就可以直接傳送到 Discord Webhook

day25-12.png

Configuration

Configuration 可以新增資料來源,加入其他的 Prometheus Server,像是下一篇要介紹的 Logs Collection - Loki,往下拉也有關聯式資料庫 MySQL、PostgreSQL

day25-13.png

下一篇設定 Loki 的時候也會教怎麼加入資料來源。

加入擴充套件還有 Service Account,Service Account 可以作為呼叫 Grafana Backend。

day25-14.png

Server Admin

主要就是用來管理 Grafana Server 的地方啦,Users 跟 Orgs 可以在這裡做管理,還有系統的環境變數也會在這裡看到。

day25-15.png

這裡簡單介紹的差不多了,剩下可以自己去探索摸出來,或者查詢文件學一下怎麼去更改 Dashboard。

監控其實還缺少一個東西,那就是每個 Container Log 資訊,可以轉到 Grafana 上面看到嗎?當然是可以的,我們會使用 Loki 來幫忙紀錄每個 Container 的 Log,下一篇就要來接上這裡。

本系列內容也會同步貼到我的 iT 邦幫忙 https://ithelp.ithome.com.tw/users/20112934 歡迎來點一下追蹤,那我們就下一篇文章見啦!