Aaron Hsieh

Site Reliability Engineering 概念與實作

前言

在現在事事講求商機的時代,商業功能的需求越來越多也越來越急,落後的功能可能就導致企業失去了市場,以致於服務團隊不斷的衝刺功能而有時將穩定的做法降級。又或著,大家都在追求功能實踐,覺得串得起來就是成就而往往忽略了穩定與運維的後續。直到服務出問題導致形象的損害才悔不當初。因此筆者強烈的建議穩定的設計要在開發與維運時要不斷檢視,不是在要推出服務的最後一關才做。

SRE

Site Reliability Engineering (簡稱:SRE),這個概念最早由 Google 工程團隊 Ben Treynor Sloss 提出。當全世界在大喊什麼都要 DevOps 與 Agile 時,Google 的工程團隊提出了 Site Reliability Engineering 概念,並公開了許多 SRE 人員的工作內容。Google 希望透過這樣的角色維持服務的穩定。

--

--