Netflixは、わざと本番障害を起こしてすぐ復旧させることを繰り返し、本当の障害発生に備える、という驚くべき手法「カオスエンジニアリング」を実践している。 その効果は実証されている。Netflixが全面的に採用... 860 人がブックマーク・159 件のコメント
「インフラ怖い」が生んだSREの業務負担――freeeはどう改善したか:運用コストを減らす3つのポイントとは(1/2 ページ) 本番環境にKubernetesを活用するfreeeでは、SREに運用管理業務が集中して疲弊してしまった。そこで、開発チームにサービスの運用管理業務を任せることで改善していったという。その方法とは? 個人事業主や法人向けにSaaSを開発、提供するfreeeは、本番環境にAmazon Web Services(AWS)の「Amazon Elastic Compute Cloud」(以下、EC2)と「Amazon EC2 Auto Scaling」(以下、EC2 Auto Scaling)を活用していた。だが、提供するサービスの増加やマイクロサービス化などに伴い、SRE(Site Reliability Engineer)に運用管理業務が集中して疲弊。そこで、開発チーム
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く