「SRE」を検索 - はてなブックマーク

241 - 280 件 / 883件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

SREの検索結果241 - 280 件 / 883件

入社したらAWSコンソールにCloudWatchアラームが1000個以上あったので整理してる話 - Uzabase for Engineers
- 200 users
- tech.uzabase.com
- テクノロジー
- 2023/02/09
こんにちはNewsPicks SREチームの飯野です。今年の1月入社の新入社員です。そろそろお仕事に慣れてきました。今回は研修と研修の合間に地道に行っていたCloudWatchアラームの整理について話していきたいと思います。ちょっと長くなりますがお付き合いください。よくわからないしアラームを整理しようまずはスプレッドシートで一覧してみよう整理の方針を決めようさまざまな問題をかかえたアラームたち Case#1 AlarmActionが未設定のアラーム（5個） Case#2 ActionのSNSトピックが存在しないアラーム（16個） Actionを差し替えるのはちょっと手間 Case#3 ActionのSNSトピックの通知先が退職した社員のメールアドレス（97個） Case#4 監視先のDynamoDBのテーブルがすでに存在しないアラーム（97個中の85個） Case#5 監視先のE
- aws
- 監視
- あとで読む
- Amazon Web Services
- techfeed
- cloudwatch
- Amazon
- monitoring
社内サービスを一括・即座・セキュアにリモートワーク開放した話 - エムスリーテックブログ
- 199 users
- www.m3tech.blog
- テクノロジー
- 2020/09/11
はじめまして。エムスリーエンジニアリンググループSREチームの山本です。先日来のリモートワーク促進の中、弊社でも多くの社員がオフィス外から接続するようになりました。もちろん、VPNを利用すれば社内のサービスも利用できますが、VPNの使用量が一気に増えるとそちらの制限にかかります。今回「VPNを可能な限り利用せず、なおかつセキュアに社内のサービスを利用してもらう」という課題に取り組みましたので、ここでその紹介をさせてください。前提方針クライアント証明書の問題点一括でのSSL化・証明書検証ドメイン変換実際の設定 Squidの設定(抜粋) unboundの設定 nginxの設定(クライアント証明書検証) nginxの設定(HTTPサーバに対するproxy) nginxの設定(個別対応) ブラウザのProxy設定その後発生した問題ポート問題 Hostヘッダ問題戻りヘッダ問
SLO策定とアラート設定までの長い道のり - Cybozu Inside Out | サイボウズエンジニアのブログ
- 199 users
- blog.cybozu.io
- テクノロジー
- 2020/11/13
こんにちは、@ueokandeです。早速ですが、皆さんが運用しているサービスには、SLO (Service-level objective: サービスレベル目標) がありますか？アラートの監視項目はどのように設定して、基準値をどのように決めていますか？社外とのコミュニケーションだけでなく、社内向けのSLOを決めておくことで、サービスの健康状態を知るための手がかりや、普段の開発・運用タスクの優先度を決める上での指標にもなります。またSLOがあると、サービスを監視するアラートに、理にかなった閾値を設定できます。この記事ではAWS版kintoneの、SLOとアラートを設定するまでの記録について紹介します。 cybozu.com版kintoneのSLOとアラート国内のcybozu.comで運用しているkintoneにも、もちろんSLOやアラートはあります。しかし現状のSLOはkinton
- SRE
- monitoring
- 運用
- 監視
- あとで読む
- cybozu
- aws
- slo
- インストール
大量にあるKubernetesをどのように運用するか　ヤフーの運用自動化の仕組み
- 197 users
- logmi.jp
- テクノロジー
- 2021/01/14
KubeFest Tokyo 2020は、Kubernetes を利用している人、これから導入したい人が新しいことを学んだり、ネットワーキングすることを狙いとして開催するワンデイのオンラインイベントです。大規模なKubernetes環境では、たくさんのクラスタが存在します。これらを監視する仕組みについて、ヤフーの勝田氏と相良氏がお話しします。前半はヤフーのKubernetesの紹介から。全2回。監視の基礎から知る、ヤフーの大量クラスタ監視システムの仕組み相良幸範氏（以下、相良）：「監視の基礎から知る、ヤフーの大量クラスタ監視システムの仕組み」という題で、ヤフーの勝田と相良が発表いたします。このセッションでは、ヤフーのKubernetesを紹介し、Kubernetesクラスタの監視・運用について基礎を振り返ります。その後、ヤフーにおいて大量のクラスタをどう効率的に運用して安定稼働を実現
- kubernetes
- あとで読む
- 運用
- k8s
- 監視
- サービス
- チーム
マイクロサービスでチームを分離したくないマン - まっちゅーのチラ裏
- 197 users
- ma2k8.hateblo.jp
- テクノロジー
- 2020/10/21
コンウェイの法則とかで、マイクロサービス=組織という話になることが多いなと感じる。正解の場合もあるし、不正解の場合もあると思っていて、個人的には小さいチームでもマイクロサービスをやるメリットは技術的にも組織的にもあると思う。そのメリットを無視してすぐ組織の話に持っていきたくないので、基本分離したくないマンとしての主張を書いておく技術観点でのメリットいまさら語るまでもないけど、ドメイン境界の分離デプロイ独立性リソースの最適配分障害の局所化(サーキットブレーカー等) このうち、ドメイン境界の分離だけはモジュラモノリスで対応可能だが、あとの3つにはマイクロサービスが必須。(もっとあるかも) この3つが必要なのにモノリス or モジュラモノリスで進める判断をするということはシステムの表現力を落とすことに直結する。もちろん、複雑度は増すし難易度も増す。熟練のサーバーサイドエンジ
Googleの徹底的なシステム障害への対応「SRE」の中身とは？
- 196 users
- gigazine.net
- テクノロジー
- 2020/03/17
インターネット上でサービスを提供する企業では、いかに自社のシステム障害と向き合うかが重要です。検索エンジンやクラウド、メール、広告など、さまざまなサービスを提供しているGoogleが、自社が提唱しているシステム管理の方法論「SRE」に基づき、システム障害にどう対応しているかを実際の事例をもとに紹介しています。 SRE keeps digging to prevent problems | Google Cloud Blog https://cloud.google.com/blog/products/management-tools/sre-keeps-digging-to-prevent-problems SREはサイト・リライアビリティ・エンジニアリングの略で、「サイト信頼性エンジニアリング」と訳されることもあります。Googleのような大規模な企業では、他の企業ではめったに起こらない
- SRE
- あとで読む
- google
- 障害
- 運用
- CPU
- cloud
Go Secure Coding Practice の日本語翻訳を公開します - Techtouch Developers Blog
- 195 users
- tech.techtouch.jp
- テクノロジー
- 2022/08/26
はじめに Go Secure Coding Practice とはコンテンツ一覧良かったところ注意すべきところ最後にはじめにこんにちは。SRE の izzii です。テックタッチのエンジニア規模もそれなりに拡大し、若手の採用も進んできたため、セキュアコーディングを徹底していきたいという思いがあり、まずは意識改革ということで勉強会を実施しました。セキュアコーディングを目的とした場合には教育だけでなく Static application security testing (SAST) の導入といった方法もあるのですが、まずは自分を含めた開発メンバーにノウハウをインストールすることにしました。セキュアコーディングへの意識が高まれば、いづれ SAST の導入の際に抵抗感も少ないだろうと考えています。いきなり SAST を導入しても、誤検知が煩くて浸透しないリスクもありうると考えてい
- go
- golang
- あとで読む
- security
- セキュリティ
- 開発
- programming
- 勉強
あなたの知らないKubernetesのServiceの仕組み | IIJ Engineers Blog
- 193 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2021/06/15
Kubernetesの主要なリソースの一つにServiceリソースがあります。ServiceリソースとはKubernetes上のPodへクラスタの外からアクセスするために使うもの、という理解をしている人が多いかもしれません。確かにそのような役割を担っているのですが、実際にはクラスタ内部に閉じた通信にも利用されていますし、実はもっといろいろな機能を持っています。端的に説明すれば、Serviceとは「ロードバランサとDNSサーバを設定するためのリソース」です。意外に聞こえますか？もし意外に思えたなら、ぜひこのまま読み進めてみてください。インターナルなロードバランサを制御する Kubernetesにはクラスタ内部に閉じた通信を制御するロードバランサが内蔵されています。Kubernetesを利用するということは、ほぼ例外なくこのロードバランサを利用しているのですが、あまり意識せずに利用されて
- kubernetes
- k8s
- あとで読む
- コンテナ
- IIJ
- loadbalancer
- service
Engineering Manager になってから身に沁みた12のアイデアと言葉 - これはただの日記
- 193 users
- kths.hatenablog.com
- 学び
- 2019/12/21
本記事は、 Engineering Manager Advent Calendar 2019 の21日目の投稿です。あなたはだれスタディストという会社で、2018/9から SRE チームの Engineering Manager を担当しています。2019/9より開発組織全体の副部長を兼任し、活動をしています。この記事を書く背景と目的そこそこ昔から、チームや組織に関する書籍が好きで読み漁っていたのですが、 Engineering Manager になってから改めてそれらの書籍を読み返すと、これまでとは違った感じ方をできるようになりました。また、買った本の読み方も大きく変わったような感覚を持っています。そんな気持ちを皆さんとも共有したいと思い、私が最近よく読み返す書籍の中から、身に沁みた言葉・考え方をいくつか紹介したいと思います。何か1つでも参考になるアイデアがあれば幸いです。 En
AWSとGCP間でVPNを設定する方法 - Gunosy Tech Blog
- 193 users
- tech.gunosy.io
- テクノロジー
- 2019/11/29
はじめに AWSのネットワーク構成 GCPのネットワーク構成 AWS と GCP 間での通信 VPN設定手順 TGWを用いたルーティングの設定 (AWS) Shared VPC の設定 (GCP) Terraform まとめはじめにこんにちは。DR & MLOps Group というところで働いている阿部といいます。Data Reliability & Machine Learning Operations の略で、データ基盤やML基盤を作って運用するグループです。私はもともとは記事配信ロジックやデータ分析をやっているグループにいましたが、今年移ってきました。こちらが紹介記事です: DREの使命とは？「数が神より正しい」と言うための正確性を求められる技術力 – Gunosiru 弊社のシステムは基本的にはAWSで動いていますが、とあるプロジェクトでGCPを使うことになりました。そ
- aws
- GCP
- VPN
- あとで読む
- network
- cloud
- ネットワーク
- DevOps
- Google Cloud Platform
- gunosy
エンジニアのためのSRE論文への招待 - SRE NEXT 2023 - ゆううきブログ
- 192 users
- blog.yuuk.io
- テクノロジー
- 2023/10/02
この記事では、2023年9月29日に開催されたSRE NEXT 2023 IN TOKYOでの講演の概要に加えて、講演では触れられなかった部分の補足と、発表を終えての後記、最後にSRE NEXT全体の感想を書きました。 SRE NEXT 2020の基調講演に招いていただいたところから始まり、昨年のSRE NEXT 2022の公募セッションでも発表し、今回で3回目の発表になりました。今回の講演は、SRE NEXTの「NEXT」と価値観の一つである「Diversity」を踏まえて、自身のエンジニアと研究者の両方の経験を活かして、SREを深く実践する上で、技術論文を探して読むアプローチを提示するものです。昨今の国内のSREコミュニティでは組織的実践に主な関心が移っている状況と対比させて、コンピュータサイエンスに基づく技術的挑戦の可能性を示唆する意欲的な講演を目指したつもりです。この講演での主要
- sre
- あとで読む
- エンジニア
- 論文
- paper
- techfeed
日本のSREの火付け役ともなったエンジニアが貫く信念 ─ すべてはログの向こうにいるエンドユーザのために - Findy Engineer Lab
- 192 users
- findy-code.io
- テクノロジー
- 2021/10/20
こんにちは、はじめまして。さくらインターネット株式会社の長野雅広（@kazeburo）です。Webの業界に入ったのは学生だった2000年頃で、キャリアは20年以上になります。おそらくこの業界でも長い方ではないでしょうか。20年の間にmixiやlivedoor、メルカリといった企業で働く機会を得て、どの職場でもサービスの裏側にあるインフラや、Webアプリケーションの運用を支える仕事、今ではSREと呼ばれるような業務に携わってきました。そして今年の1月から、さくらインターネットにてクラウドを中心にサービスの開発を行っています。つまり、インフラやクラウドを利用して一般のお客様向けにサービスを作るという仕事から、クラウドを作ることを仕事にする、という選択をしました。この記事では、どのような経験からSREとして働くようになったのか、また現職に至る選択をした経緯について語りたいと思います。加えて、
- SRE
- あとで読む
- isucon
- エンジニア
- kazeburo
- engineer
- 会社
- 開発
3大クラウド(AWS,Azure,GCP)をそれぞれプロダクションで実運用した感想(その3 AWS固有の優位性について) - Qiita
- 192 users
- qiita.com/lazy-kz
- テクノロジー
- 2023/09/11
3大クラウド(AWS,Azure,GCP)をそれぞれプロダクションで実運用した感想(その3 AWS固有の優位性について)AWSAzureGoogleCloud はじめに今年のはじめに書いた3大クラウドの比較シリーズに関して長いこと続編を書いてませんでした...。最近、知人/友人のみならず取引先からも「AWSやGCPに関して続編書かないんですか？」と言われることが増えてきたので、今回はAWSを本番運用していて感じたAWS固有の優位性について感想を述べていきます。 AWS 固有の優位性周知の事実ではありますが、AWSは長年クラウドベンダーとして世界トップシェアを維持し続けています。 AWSをクラウド基盤として利用しているサービスを一切利用せずに1日を過ごすことは不可能なんじゃないかというレベルで日本国内では利用されています。もはや電気/ガス/水道等の社会インフラに近い状態です。そして
- aws
- あとで読む
- gcp
- azure
- Google Cloud
- インフラ
- Microsoft Azure
- cloud
- クラウド
- techfeed
GitHubのトレンドで振り返る2021年のJavaScript/TypeScript
- 192 users
- blog.leko.jp
- テクノロジー
- 2021/12/25
今年も GitHub のトレンドで 2021 年の JavaScript/TypeScript を振り返ります。去年の記事はこちらです。 — GitHub のトレンドで振り返る 2020 年の JavaScript | WEB EGG 集計方法 GitHub トレンドは過去の履歴を公式に提供していないため、非公式に集計されたデータを利用しています。データソースはlarsbijl/trending_archiveを使用去年はxiaobaiha/github-trending-historyを利用したが今年のデータは無かったので変更日ごとにまとめた markdown になっており、remark で AST→ データ化しました集計期間は 2021/01/01 から 2021/12/15 まで対象言語はJavaScriptとTypeScriptのみ集計後のデータはこちらのスプレッドシー
- javascript
- github
- あとで読む
- TypeScript
- ツール
- node
- js
- dev
- 開発
AWSからオンプレミスに移行したWebRTC配信サーバのその後 - DMM inside
- 191 users
- inside.dmm.com
- テクノロジー
- 2021/12/21
｜DMM inside
- aws
- あとで読む
- WebRTC
- サーバ
- オンプレ
- 運用
- dmm
- CPU
- コスト
- SRE
Aurora MySQL でレコードが存在するのに SELECT すると Empty set が返ってくる事象を調査した話
- 191 users
- blog.kinto-technologies.com
- テクノロジー
- 2023/05/13
こんにちは。 KINTO テクノロジーズの DBRE チーム所属のp2skです。 DBRE（Database Reliability Engineering）チームでは、横断組織としてデータベースに関する課題解決や、組織のアジリティとガバナンスのバランスを取るためのプラットフォーム開発などを行なっております。DBRE は比較的新しい概念で、DBRE という組織がある会社も少なく、あったとしても取り組んでいる内容や考え方が異なるような、発展途上の非常に面白い領域です。弊社における DBRE の取り組み例としては、あわっち（@_awache）による DBRE ガードレール構想の実現に向けた取り組みについてというテックブログや、今年の AWS Summit の登壇内容を是非ご覧ください。今回の記事は、データベースに関する課題解決の事例として「Aurora MySQL でレコードが存在するのに
- mysql
- Aurora
- aws
- あとで読む
- DB
- データベース
- トラブル
ITエンジニアの働き方を尊重し、技術的な成長を促進する開発組織に求められるものとは？ ──ユーザベースの取り組みに見る - はてなニュース
- 190 users
- hatenanews.com
- テクノロジー
- 2021/06/29
ITエンジニアが働く環境を選ぶ際に「技術的な成長が期待できるかどうか？」はとても重要な指標です。技術的な裁量が大きいことや学習機会が用意されていることだけでなく、チーム編成や評価といった仕組みの部分にまでエンジニアを尊重した文化が浸透していれば、その企業は極めて働きやすいと言えるでしょう。エンジニアが尊重される文化を醸成する仕組み作りの事例として、ペアプログラミングによる知見の共有を推し進め、プロダクトに導入する技術選択にもかなりの自由を持たせているユーザベースに、エンジニアを支える開発組織と企業文化について聞きました。今回は、スペシャリストとしてFellowの肩書きを持つ矢野勉さん（上記画像左下）と、入社2年目の廣岡佑哉さん（左上）にそれぞれの働き方を語ってもらい、CTOの林尚之さん（右上）には組織としての考え方をうかがいました（※取材はWeb会議ツールでリモート実施しました）。 ※
- エンジニア
- あとで読む
- 技術
- 開発
- 組織
- チーム
- 言語
- 会社
- 勉強
スケールアウトの落とし穴から学ぶ、SREチームでのダッシュボードのアップデート術 - MonotaRO Tech Blog
- 190 users
- tech-blog.monotaro.com
- テクノロジー
- 2021/05/20
どんなことが起こったのか？モノタロウのサイトの監視についてレイテンシ監視トラフィック監視エラー監視リソース監視ログトラブルシュートの進め方発生検知発生箇所の特定根本原因の調査強化課題おわりに SREチームの市原(@ichi_taro3) です。モノタロウでは、www.monotaro.com という大規模なECサイトを自社で開発、運用しています。 Webアプリケーションの運用ではトラブルはつきものです。今回は、とあるトラブルシュート事例を軸に、どのように運用を改善しているのかについて紹介します。どんなことが起こったのか？あるとき、モノタロウのWebサービス全体でレイテンシ悪化やバックエンドAPIへのタイムアウトの増加が頻発したことがありました。当然これらは歓迎される状況ではなく、すぐに開発者やSRE、インフラチームの担当者が集まり調査を開始しました。現象は
- sre
- あとで読む
- 監視
- 運用
- infrastructure
- サービス
- インフラ
- performance
- サーバ
- tech
「Datadog入れてみたらAWSの料金が爆発した話」@ゆるSRE勉強会 #1
- 189 users
- speakerdeck.com/rynsuke
- テクノロジー
- 2023/08/29
ゆるSRE勉強会 #1 でお話しさせて頂いたLTの資料です！ https://yuru-sre.connpass.com/event/292063/
- aws
- あとで読む
- Datadog
- 運用
- sre
- cost
スタディサプリ最大のRailsアプリケーションにYJIT+pitchforkを導入してメモリ使用量を劇的に削減するまで - スタディサプリ Product Team Blog
- 187 users
- blog.studysapuri.jp
- テクノロジー
- 2024/04/02
こんにちは。SREのkyontanです。Rubyが大好きなのでRubyの話をします。ちなみにリクルートはRubyKaigi 2024へGold Sponsorとして協賛しています! *1。ぜひ沖縄でお会いしましょう。これはあるアプリケーションのメモリ消費量を示すグラフなのですが、まさかgemを入れ替えるだけでこんなに嬉しい変化が見られるとは思っていませんでした。今日はそんなgemの話をします。話は遡って2023年4月のある日、インターネットを眺めていたところ、ShopifyがpitchforkというOSSを公開したという情報が目に留まりました。調べてみると、どうやら著名なRackサーバー実装の1つであるunicornの派生版であり、メモリ使用量の削減に特化しているらしいのです。 github.com これはスタディサプリ小中高のあのリソースドカ食いマイクロサービス第一位である api
- rails
- あとで読む
- pitchfork
- ruby
- rack
- performance
- gem
- API
秘密情報には出どころも書いてくれ！頼む！ - KAYAC engineers' blog
- 185 users
- techblog.kayac.com
- テクノロジー
- 2022/12/11
SREチームの長田です。 KAYAC Advent Calendar 2022の11日目の記事です。アプリケーションから何かしらの外部サービスを利用するとき、そのサービスを利用するためのAPI Keyなり秘密鍵なりの秘密情報を保持することになります。暗号化したものをファイルとしてアプリケーションに持たせたり、 Amazon Web Services(AWS)ならAWS Secrets Managerや AWS Systems ManagerのParameter Store(SSM Paramater Store)に保存したものを実行時に読み込んだりするでしょう。これらの秘密情報、どこから来たのかわかりますか？どこから来た秘密情報なのか秘密情報を使って出どころを調べられるのであれば問題はないでしょう。 # 例えばAWSのIAM User Credenntialsとか $ AWS_A
Fintechサービスをスピーディーに立ち上げる技術スタック LINEエンジニアに和田卓人さんが聞く TypeScriptとマイクロサービス基盤 - はてなニュース
- 185 users
- hatenanews.com
- テクノロジー
- 2020/12/22
多くのユーザーに常用されるコミュニケーションアプリ「LINE」には、エンターテイメントやライフスタイル、ショッピングなど多種多様な関連サービスがあります。その中でスマホ投資サービス「LINE証券」や、外国為替証拠金（FX）取引の「LINE FX」、個人向けローンサービス「LINEポケットマネー」、「LINE」アプリ上で損害保険に加入できる「LINEほけん」などファイナンシャル（金融）系サービスの展開も拡大しています。こういったFintech事業に、LINEエンジニアはどう取り組んでいるのか？「LINE証券」を開発する3名に、事業を支える技術の詳細を伺いました。聞き手は、テスト駆動開発の第一人者でありITコンサルタント・ソフトウェアエンジニアの和田卓人（@t_wada）さん。信頼性と高速性の両立が求められるFintech領域において、LINEはどのような工夫を行っているのでしょうか。
- 開発
- あとで読む
- line
- FinTech
- TypeScript
- Java
- React
- 設計
- 技術
NLB + Fluentd の構成でファイルディスクリプタが枯渇する謎の現象を解消した話 - Repro Tech Blog
- 185 users
- tech.repro.io
- テクノロジー
- 2019/07/03
Repro インフラチーム (SRE + 分析基盤) の伊豆です。今回は、Repro のデータ収集基盤で私たちが遭遇した問題を紹介したいと思います。具体的には、AWS Network Load Balancer(NLB) + Fluentd の構成でファイルディスクリプタが枯渇する謎の現象に遭遇したので、その問題の調査記録と解決策を共有します。また、この問題を解消するにあたり Fluentd に PR を送ったのでそれの紹介もします。 https://github.com/fluent/fluentd/pull/2352 データ収集基盤の構成 Repro のデータ収集基盤はFlunetd High Availability Configをもとに構成され、大まかに次のようになっています。 SDK からアップロードされたデータは、転送用 Fluentd(log forwarders)を経由し
- fluentd
- nlb
- aws
- あとで読む
- TCP
- ulimit
- ECS
- network
EKSからECSに移行して開発運用コストの削減を図る - KAYAC engineers' blog
- 184 users
- techblog.kayac.com
- テクノロジー
- 2022/09/29
SREチームの長田です。今回はカヤックで運用している「まちのコイン」というプロダクトのアプリケーション基盤を Amazon EKS(以下EKS)からAmazon ECS(以下ECS)に移行したはなしをします。まちのコインとは coin.machino.co www.kayac.com まちのコインはカヤックが運営している、デジタル地域通貨を使ってその地域のコミュニティを活性化させるサービスです。 2019年11月から実証実験を開始し、翌年2月から正式リリースされました。 2022年9月現在、20の地域に導入されています。一般ユーザーが使用するクライアントアプリと、導入地域の運営団体が使用するブラウザ用の管理画面、それらにAPIを提供するRailsサーバーアプリがあります。データベースはAmazon Aurora PostgreSQL、その他AWSのマネージドサービスを組み合わせ
- ECS
- あとで読む
- kubernetes
- EKS
- 運用
- aws
- 開発
スクウェア・エニックスの"とあるシステム"のSite Reliability Engineering
- 184 users
- blog.jp.square-enix.com
- テクノロジー
- 2022/11/22
はじめにこんにちは、情報システム部 SRE 橋本です。普段はクラウドエンジニア(SRE)としてチームリードをしています。興味関心がインフラ、Observability、SRE、Security、Golangといった分野であり、 Japan Google Cloud Usergroup for Enterprise(Jagu’e’r ジャガーと読みます)でObservability/SRE分科会のオーナーを担当させていただいております。その縁もあって先日Innovators Hive at Cloud Next 2022でコミュニティ運営についてお話をさせていただきました。この記事では現在チームリードをしていてビルドアップ中でもあるSREチームについて考えていることをお話したいと思います。また、このSREチームについてのインタビュー記事も掲載いたしました。メンバーやチームの雰囲気を伝
- SRE
- あとで読む
- 運用
- インフラ
- サーバ
- システム
- 開発
- engineering
- 組織
新卒で入社した合同会社DMM.comを退職しました - y-ohgi's blog
- 184 users
- y-ohgi.blog
- 政治と経済
- 2020/01/23
from: 合同会社DMM.com CTO室 to: フリーランス DMMどうだった良かった。なにしてたの新卒で入社し、3年ぐらいクラウドをいい感じにするエンジニアしてました。新規サービス立ち上げたり、リプレイスしたり、リファレンスアーキテクチャ作ったり、スクラムマスターしたり、とかとか。あと80回ぐらい社内勉強会（勉強会・LT会・Podcast）主催したりもしました。新卒入社 > プラットフォーム部 > CTO室 > SRE立ち上げ > CTO室 > 退職詳しくは「転職先募集 - y-ohgi's blog」でいろいろ書きました。なんで辞めたの理由としては新しく入ってきた上司（x3人）と折り合いがつかなかったことと、折り合いがつかなかった結果やりたいこと（全社のクラウド活用をいい感じにすること）ができなくなったため辞めました。特に何かが嫌になったとかではないです。よ
- 退職
- あとで読む
- DMM
- 仕事
- 会社
エンジニアリングマネージャーとしての開発力向上の取り組みついて - Qiita
- 183 users
- qiita.com/KUMAN
- テクノロジー
- 2021/12/16
スクワッド体制における留意点として、「Spotifyは "Spotifyモデル "を使っていない [3]」で以下のように述べられているように、単に方法論を真似るのではく、自分の組織と向き合い、学習して、進化し続けることが大切であると思います。READYFORにおいても日々、組織体制について議論し、改善を進めています。ビジネスユニット、部門、チーム、マネージャーは、Spotifyの失敗した方法論に固執してはいけません。彼らはSptifyのモノマネよりも効果的に組織構造の役割と責任を伝えることができるのです。あなたがSpotify Modelを見つけたのは、自分のチームをどのように構成するかをいつも考えていたからでしょう。でもここで止まってはいけません。学習を続けてください。 1-2. READYFORのスクワッド体制 READYFORの場合、どのようなスクワッド体制を敷いているか？ひと
NewsPicksはDX向上に徹底的に注力する - エンジニアを採用し、スケーラブルな開発組織をつくるために - はてなニュース
- 182 users
- hatenanews.com
- テクノロジー
- 2021/04/26
ソーシャル経済メディア「NewsPicks」の運営・開発を行う株式会社ニューズピックスは、近年、DX（Developer Experience：開発者体験）の向上に注力しています。CPO、CTO、VP of Eと、3名のエンジニアがボードメンバーに名を連ねる同社のDXへのこだわりは徹底しており、「DX向上」は経営における重要項目としても取り扱われています。背景にあるのは、エンジニア組織をスケールさせる、という強い意思。近年、同社の開発組織は著しく拡大していますが、今後、さらにエンジニアを迎え入れるためには、良質なDXが得られるシステム、組織であることが不可欠だと考えているといいます。では、肝心要のDX向上はどのようにデザインされ、実行されているのでしょうか。本稿の読者も含め、世のエンジニアの方々に向けて同社のDXをプレゼンテーションし、応募を促進するべく、CTOの高山温さん、そして最前
- エンジニア
- あとで読む
- DX
- 開発
- 組織
2010年代に日本のインターネットでいろんな事業をいい感じにやってきた会社から2020年代へのヒントをもらえる本を作った - golden-luckyの日記
- 181 users
- golden-lucky.hatenablog.com
- テクノロジー
- 2020/08/07
半年ぶりの新刊です。『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』です。紙とPDFがセットになった直販サイトはこちら。 Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち（紙書籍＋電子書籍） https://www.lambdanote.com/products/engineers-in-voyage さて、今回の新刊、いろいろ疑問を呼ぶタイトルかもしれません。「なぜ VOYAGE GROUP？」「なぜ t_wada？」「なぜ宇宙船？」「答えは本書で！」と言って済ませることもできるのですが、ここで少し「個人的」なふりかえりをして何となく答えた気分になっておこうと思います。なぜ VOYAGE GROUP？なぜ t_wada？なぜ宇宙船？で、結局のところどういう本なの？気合い入ってますなぜ VOYAGE G
postfixによる大量メール送信にまつわる問題と対処 - エムスリーテックブログ
- 179 users
- www.m3tech.blog
- テクノロジー
- 2023/06/07
【SREチームブログリレー2回目】お疲れ様です。エンジニアリンググループ、コアSREの山本です。前回ブログリレー1回目の記事で大量メール送信のために基本設定について書かせていただきました。 www.m3tech.blog 今回はそれを受けて構築したサーバで実際に発生したいくつかの問題、その問題への対処といったものを書かせてください。エムスリーのメール送信で発生した問題とその対策特定のメールサーバからの突然のメール拒否メールの翌日までの滞留 TLS問題メールがどうしても迷惑メール扱いされるという苦情 postfixのメール処理とステータスメールログの監視まとめ We are Hiring! エムスリーのメール送信で発生した問題とその対策実際にここ一年あたりの間に発生した問題とその問題への対応を記述していきたいと思います。postfixを利用して送信していますので設定はpo
- postfix
- メール
- あとで読む
- mail
- サーバ
- インフラ
- SRE
- email
- ネットワーク
10倍に膨れたAWS運用費をどう減らす？　ユーザー急増のnoteが挑む「コスト削減作戦」の裏側
- 179 users
- www.itmedia.co.jp
- テクノロジー
- 2021/10/29
10倍に膨れたAWS運用費をどう減らす？　ユーザー急増のnoteが挑む「コスト削減作戦」の裏側（1/2 ページ）文章やイラストなどを投稿できるコンテンツ配信サービス「note」。コロナ禍以降は巣ごもり需要にも後押しされてユーザー数が急増しており、2020年には月間アクティブユーザー数が前年同期比で3倍以上に増えたという。しかし同時にトラフィック量も急増したため、運営元であるnote社のシステム部門ではその対応に追われた。特にクラウドサービスの利用コストの高騰は、大きな悩みの種だった。 noteのサービスを支えるシステムは、全てAWS（Amazon Web Services）のクラウドインフラ上で構築・運用しており、トラフィック急増でその利用コストは約10倍にまで膨れ上がった。このままトラフィックがさらに増えれば、コストが利益を食いつぶすことにもなりかねない。そこでシステムの運用や品質管
- aws
- あとで読む
- 運用
- コスト
- SRE
- Amazon Web Services
- note
- サービス
- 仕事
「入門監視」5年を経て変わったこと、変わらないこと / Fundamental principles in Practical Monitoring
- 179 users
- speakerdeck.com/doublemarket
- テクノロジー
- 2022/06/10
2022年6月2日に開催された、Observability Lounge 「『監視』の原則と変化」という勉強会での発表資料です https://forkwell.connpass.com/event/247721/
- 監視
- あとで読む
- monitoring
- SRE
- ネット
- programming
チーム内勉強会の進め方事例 - MNTSQ Techブログ
- 178 users
- tech.mntsq.co.jp
- テクノロジー
- 2024/05/10
おはようございます!こんにちは!場合によってはこんばんわ! SREチームマネージャーの藤原です。今年の3月からSREチームの中で、勉強会を定期的に実施するようになりました。本エントリでは勉強会を開催するにあたって考えたことと、実際の進め方についての事例解説です。勉強会を通じて実現したいことの説明から、テーマ設定、効果最大化のための開催形態と頻度、現時点(2024/4・5時点)の結果について解説しています。勉強会を通じて実現したいことチーム内勉強会を通じて実現したいこととして、以下を設定していました。チーム・個人としてのレベルアップ積極的な議論への参加相互理解チームとしての目線合わせ勉強会を開催するからには何かしらのスキルや考え方を身に付けたいはずです。また、学習効果を最大化するためにも、積極的な議論への参加を実現したいと考えました。さらには、勉強会の中での議論を通じ
- チーム
- あとで読む
- 勉強
- 学習
- エンジニア
- 仕事
- work
- コメント
MySQLのutf8mb4と戦った話 - Uzabase for Engineers
- 178 users
- tech.uzabase.com
- テクノロジー
- 2023/04/28
皆様こんにちは、NewsPicksエンジニアの米澤です。先日 2023/03/30は、こちらでアナウンスしていた通り、サービスの停止を伴うシステムメンテナンスを実施させて頂きました。 NewsPicksをご利用頂いている皆様には、ご迷惑おかけいたしました。今回はこのメンテナンスの中で行われたDBテーブルのmigrationについてお話ししたいと思います。ことの始まりやったこと方針決め utf8mb4に対応していないテーブルを調べる migrationを作成する影響範囲を調べる開発環境でリハーサルを行うメンテナンスの日最後にことの始まり NewsPicksではバグの検知にBugSnagを利用しています。ある時、BugSnagにこんなエラーが通知されてきました。 org.springframework.orm.hibernate4.HibernateJdbcExcepti
- mysql
- あとで読む
- db
- 文字コード
- utf8mb4
- 環境
- unicode
- 開発
- システム
- development
Terraformを使って学ぶーAWSにインフラを構築するIaCの基本と、SREが実務で役立つ機能とエコシステムを徹底解説｜ハイクラス転職・求人情報サイト AMBI（アンビ）
- 178 users
- en-ambi.com
- テクノロジー
- 2023/09/22
ハイクラス求人TOPIT記事一覧Terraformを使って学ぶーAWSにインフラを構築するIaCの基本と、SREが実務で役立つ機能とエコシステムを徹底解説 Terraformを使って学ぶーAWSにインフラを構築するIaCの基本と、SREが実務で役立つ機能とエコシステムを徹底解説 Terraformは、パブリッククラウドのインフラ構築と自動化のツールとして、IaCのデファクトスタンダードとなっています。この記事では、AWS（Amazon Web Services）を活用するハンズオンを通してTerraformの動作を理解し、実務にもとづいて役立つ機能や便利なエコシステム、さらにSRE視点の事例を紹介します。アソビュー株式会社でSREユニットリーダーを務める鈴木剛志さんを中心に6名のメンバーによる共同執筆です。アイキャッチ画像アソビューでは、インフラストラクチャーの変更管理にTerrafo
- terraform
- あとで読む
- Amazon Web Services
- DevOps
- IaC
- techfeed
- SRE
- aws
技術書典#13向けに「Amazon CloudWatch [本格]入門」を執筆しました - How elegant the tech world is...!
- 177 users
- iselegant.hatenablog.com
- テクノロジー
- 2022/09/10
はじめにお久しぶりです。最近は疎かになっていましたが、久々のブログ投稿となります。今回はタイトルの通り、技術書典#13向けに「Amazon CloudWatch [本格]入門」を執筆しました。本ブログにて少しご紹介できればと思います🚀 techbookfest.org 今回も表紙がかなりかわゆい感じになっていますが、内容はガチガチの技術書です。書籍の位置付け技術書典はかれこれ2019年にオンライン開催された技術書典8が初参加です。その時はコンテナ(Amazon ECS / AWS Fargate)+CI/CDを主テーマにした「クラウドネイティブファーストストーリー」を執筆しました。 2年後の技術書典11にて、同じくクラウドネイティブシリーズ第2弾として「比べてわかる！IaCの選びかた」を世に送り出しました。 booth.pm booth.pm 今回の書籍は、そのクラウドネイテ
EC2とcronで動いていたバッチ基盤をマネージド化した - Uzabase for Engineers
- 177 users
- tech.uzabase.com
- テクノロジー
- 2023/12/21
概要ソーシャル経済メディア「NewsPicks」SREチームの中川です。皆さんはバッチ処理基盤はどうされていますでしょうか。 NewsPicks では少し前まではそれらをEC2、cronの組み合わせで動作させていました。何年も前からこの仕組みだったのですがSREとしてはEC2の面倒見るのも手間ですし、それ以上にcronを変更する際のオペレーションミスが目立ったのが懸念点でした。その為、まずはAWSマネージド化するための基盤を整備し、その後バッチアプリを載せ替えていくようにしました。対応前の基盤構成同じSREチームの安藤さんが CloudNative Days Tokyo 2023 で登壇されたときの資料をお借りします。ご覧の通り、大体のサービスはマネージド化していましたがバッチ基盤だけは旧来のままEC2インスタンスを利用していました。 10年モノのサービスのインフラを漸進的
- aws
- あとで読む
- ECS
- cron
- バッチ
- batch
- Architecture
30分でわかるFour Keysの基礎と重要性
- 176 users
- speakerdeck.com/yigarashi
- テクノロジー
- 2022/10/28
ソフトウェアデリバリーのパフォーマンスを示す4つの指標であるFour Keysについて、指標の成り立ち、改善する意義、各指標への向き合い方、近年の動向などを網羅的に解説しました。
オブザーバビリティにはお金がかかる - 株式会社ヘンリーエンジニアブログ
- 174 users
- dev.henry.jp
- テクノロジー
- 2023/08/22
tl;dr オブザーバビリティにはあなたの直感よりもお金がかかるかもしれない。でもそれはアジリティを上げるために必要なコストである。同時にオブザーバビリティ関連ベンダーには、それらをリーズナブルに提供してもらうことを期待します。オブザーバビリティ・エンジニアリング輪読会 8月からVPoEになりました。id:Songmuです。社内の勉強会で輪読形式でオブザーバービリティ・エンジニアリングを読んでいます。毎週30分、参加者の中から発表者を割り当て、1~2章を読み進めるスタイルです。ちなみに、ヘンリーではActive Book Dialogue(ADB)というフォーマットも取り入れて輪読会が運営されています。社内で同時並行で数本走っており、先日、CEOの逆瀬川が書いたソフトウェア見積もりに関する輪読会も同様の形式で実施しています。発表者は、事前に社内のNotionにその章のアウトラインや
我が家のおうちKubernetesの成長記録 | IIJ Engineers Blog
- 174 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2021/12/16
【IIJ 2021 TECHアドベントカレンダー 12/16（木）の記事です】 IIJ Raptorサービス部のエンジニア、RyuSAです。普段はアプリケーションの実装やアーキテクチャ、最近はKubernetesを使った業務を担当しています。私事ですが、先日IIJの制度として発表された「セレクトジョブ」に参加し、SRE推進部という部署に兼務するようになりました！> IIJ、社員の自律的なキャリア形成を支援する公募型兼務制度「セレクトジョブ」を開始 | IIJについて | IIJ さて本題に入りますが……自分は今年の春に「おうちKubernetes」を植え、自宅で育ててきました。 > おうちKubernetesを構築した話 – メモ – RyuSA (hatenablog.com) 残念ながら自分の家庭はサーバラックがあるような、俗に言う「逸般の誤家庭」ではないためできることはかなり限ら
- kubernetes
- あとで読む
- k8s
- Grafana
- 仮想マシン
- 技術
- コンテナ
- GitHub