SRE本輪読
会社でやったSRE本の輪読。後半のアルゴリズムは口頭で説明したからあっさり。 Load Balancing in the Datacenter ・データセンター内での負荷分散について ┗クエリのストリームを負荷分散するアルゴリズムについて データセンターに到達するクエリのストリ…
勤め先でSRE本を輪読している時のメモ。 ### オンコール対応オンコール対応は、サービスの信用性と可用性を保つための重要な仕事 11.1 イントロダクション・オンコールの対応は専門の運用チームにより実施されてきた・googleではSREチームが実施している →ソ…
勤め先でSRE本の輪読をしている時のメモ。# サービス障害の追跡 ・長期にわたる信頼性の向上は基準点を設定して進捗のトラッキングが可能なことが条件 ・Googleではoutlatorというシステムを利用 └アラートを受信 データにラベリング グループ化 分析を提供 …