SRE本輪読

Chap 20 - Load Balancing in the Datacenter

会社でやったSRE本の輪読。後半のアルゴリズムは口頭で説明したからあっさり。 Load Balancing in the Datacenter ・データセンター内での負荷分散について ┗クエリのストリームを負荷分散するアルゴリズムについて データセンターに到達するクエリのストリ…

Chapter 11 - Being On-Call

勤め先でSRE本を輪読している時のメモ。 ### オンコール対応オンコール対応は、サービスの信用性と可用性を保つための重要な仕事 11.1 イントロダクション・オンコールの対応は専門の運用チームにより実施されてきた・googleではSREチームが実施している →ソ…

Chapter 16 - Tracking Outages

勤め先でSRE本の輪読をしている時のメモ。# サービス障害の追跡 ・長期にわたる信頼性の向上は基準点を設定して進捗のトラッキングが可能なことが条件 ・Googleではoutlatorというシステムを利用 └アラートを受信 データにラベリング グループ化 分析を提供 …