《關於我怎麼把一年內學到的新手 IT/SRE 濃縮到 30 天筆記這檔事》 Day 30 完賽宣言 - 下一步該如何走?

本篇大綱

這篇來總結這 30 天學了哪些東西,要怎麼繼續學習 IT/SRE 的相關知識,還有完賽心得。

內文

終於 Day 30 啦!這篇來回顧一下學習了哪些東西:

  • Day 02 ~ 04:從基礎架構設定的 OpenStack,規劃網路、安全性群組、Key Pair。
  • Day 06 ~ 07:快速安裝 Kubernetes Production Cluster 的 Kubespray,新增刪除節點。
  • Day 08 ~ 12:用實戰了解 Kubernetes 基礎元件運作,組合基本服務。
  • Day 14 ~ 15:知道基礎元件以後就可以邁向組合 & 方便的 Helm,安裝 & 自訂 Application。
  • Day 16 ~ 17:Load Balancer External IP 不是只有公有雲的專利,私有雲也可以使用 MetalLB。
  • Day 18 ~ 22:對內部跟外部的 Service 管理使用了 Istio 作為 Service Mech,回到 OpenStack 網路組合 Istio Ingress,並且跟 Cloudflare 串接 TLS Key。
  • Day 23:OpenStack 的硬碟可以讓 Persistent Volume 跟隨 Persistent Volume Claim 動態建立。
  • Day 24 ~ 26:系統的監控服務,Prometheus 儲存 Metric,Loki 儲存 Log,Grafana 作為前端顯示 Dashboard。
  • Day 27 ~ 29:最後,用 GitLab + Runner 實戰出自動部署 Application。

除了 OpenStack 環境架設跟 Load Balancer 串接以外,其他都是我花了一年學習整理的技術 & 結果,基本具備該有的都有,基礎服務到監控還有 GitLab 自動部署,公司如果想要初期引入這些技術,可以用這個做為基本評估。

不過這裡我想提點一下,因為這裡我沒有使用 OpenStack,OpenStack 要如何安裝還有網路問題等我也沒有安裝的經驗,還有像是 MetalLB 需要把 ARP 保護關閉才能使用 External IP。如果需要建構 Infrastructure 我個人建議會使用 Proxmox VE,組合 PVE Cluster,裡面的 VM 使用 Cloud Image 作為 Base,也可以達到跟 OpenStack 一樣的效果。

下一步該怎麼走?

先從思維層面的部分講起,可以推薦 https://sre.google 上的書籍,英文電子書都是免費的,可以下載 PDF,能更理解 SRE 需要做哪些事情。DevOps 導入過程會有一定的陣痛期,不是說導入 DevOps 就不會犯錯,重點是如何接受錯誤並改善問題。

day30-01.png

系統監控的部分,蒐集 K8s Cluster Metric 或 Logs 以外,其他設備也有類似的功能,像是 SNMP 跟 Syslog,SNMP 可以紀錄網路設備的上傳下載流量,Syslog 會把設備上的 Log 傳送到指定地方。

蒐集後再使用 Grafana 把資料圖表化,要追蹤就不需要再一個一個打開設備檢查了,查詢 Grafana 可以先初步理解問題,再去針對設備做追蹤。

day30-02.png

如果你有一點閒錢,你也可以購買 Qwiklabs 的訂閱來跑 GCP 的實作課程,但偶爾會遇到一些 Bug 問題,想要等免費的話可以追蹤 Google Developers Groups Taiwan 粉絲專頁,每次 Study Jam 都會有免費的一個月 Subscription,做完指定任務也有禮物,可以說是「摸蛤仔兼洗褲」。

day30-03.png

GitLab CI/CD 需要做導入的話,就要想能帶來的效益,手動整合部署跟自動整合部署相比下來,一開始後者花的時間會比較多,需要把流程思考整理,但只要撐過去,這種日常工作就不需要去煩惱,可以去專注完成其他事情。

day30-04.png

程式語言的部分,可以考慮用 Go,因為 Kubernetes 就是 Based on Go,想要做 Web 端整合變成 Control Plane,用 Go 作為後端去跟 K8s API 串接較為容易。

day30-05.png

資訊安全的部分,記得定期更新 K8s 版本,K8s 逐漸變為趨勢的同時,意味著攻擊的相關程式會越來越多,隨時注意資安動向和 CVE 相關資訊,落實 Security 在日常當中,保留這樣的 Concept 很重要。

完賽心得

這樣參賽下來,真的要給每個鐵人賽完成 30 天 Respect,參加鐵人賽是真的很累,這裡每一篇看到的內容,都是這段期間熬夜換來的,做出成果只是有個 PoC (Proof of Concept),接下來要去寫出來做為教學,就需要注意前後有沒有矛盾,或者容易搞混的概念,一篇文章 10 分鐘滑過去差不多就需要用 10 小時來完成。

文章基本上也不算是當天寫完,存量維持在 4 ~ 5 天左右,保留可以校稿的時間,尤其我對於品質要有一定的要求,自己當天寫品質不會好到哪裡去,趕稿當中一定會出差錯,希望我寫的教學文章品質不要是參差不齊,有機會我再用 Blog 跟大家聊聊鐵人賽的一些想法。

《關於我怎麼把一年內學到的新手 ITSRE 濃縮到 30 天筆記這檔事》系列就到這裡結束了,感謝各位看到這裡,如果有照著步驟碰到問題,或者你把它完成,歡迎留言給我讓我知道。

歡迎用 RSS 追蹤我的 Blog https://blog.yangjerry.tw,我的 Instagram 帳號 @tico88612,我的 iT 邦幫忙 https://ithelp.ithome.com.tw/users/20112934,我是梯口 a.k.a tico88612,我們有緣再見!


《關於我怎麼把一年內學到的新手 IT/SRE 濃縮到 30 天筆記這檔事》 Day 30 完賽宣言 - 下一步該如何走?
https://blog.yangjerry.tw/it2022-day30/
作者
Jerry Yang
發布於
2022年10月15日
許可協議