並び順

ブックマーク数

期間指定

  • から
  • まで

441 - 480 件 / 810件

新着順 人気順

SREの検索結果441 - 480 件 / 810件

  • 今さらながら2023年の振り返りと2024年の展望。CTOとは。 - Sweet Escape

    はじめに すでに2024年も10日目が過ぎて、もちろん仕事始めもしているのですが昨年中に間に合わなかった振り返りとかをしていこうかなと思います。 前提 自分は株式会社Singular Perturbations(以下SP)というスタートアップで取締役CTOをしている。この会社は『犯罪予測』というテクノロジーを研究開発し、それをもとにしたソリューションをプロダクトとして提供している。 また、これとは別に妻と一緒に会社をやっている。とはいえ自分はこの会社のオーナーではあるが代表取締役社長は妻となっている。自分は役員ですらない。 2023年を一言で言うと 『停滞』の一言につきる。といってもこれはあくまでもエンジニアとしての停滞という意味。 どういうことかというと2023年はプロダクトの開発ということ自体をあまりしなかったのもあるし、仕事としてソフトウェアエンジニアリングの観点で新しいこともあまり

      今さらながら2023年の振り返りと2024年の展望。CTOとは。 - Sweet Escape
    • はてなのポッドキャスト Backyard Hatena #30 - Embedded SREと福岡(id:cohalz) #byhatena - Hatena Developer Blog

      こんにちは、CTO の id:motemen です。 はてなのエンジニア組織である技術グループでやっているポッドキャスト「Backyard Hatena」を更新しました。 「Backyard Hatena」は、株式会社はてなのメンバーの普段の様子や、サービス開発の裏側や技術、取り組みなどについて、CTO の id:motemen を中心としたメンバーがカジュアルにお届けするポッドキャストです。 podcasters.spotify.com Backyard Hatena • A podcast on Spotify for Podcasters Anchor / Spotify / Google Podcasts / Apple Podcast で配信しています。お好みのプラットフォームから聞いていただけると嬉しいです。 今回のゲストは、はてなブックマークチームのSRE id:cohalz

        はてなのポッドキャスト Backyard Hatena #30 - Embedded SREと福岡(id:cohalz) #byhatena - Hatena Developer Blog
      • 道を照らす: プラットフォーム エンジニアリング、ゴールデンパス、セルフサービスのパワー | Google Cloud 公式ブログ

        ※この投稿は米国時間 2023 年 9 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。 入社したばかりの Java デベロッパーが、簡単な Java サービスを作る仕事を割り当てられたとしましょう。DevOps モデルでは開発チームと運用チームが責任を共有するので、Java コードだけでなく、ビルド パイプラインやモニタリング計測のような運用コードの作成も求められるかもしれません。しかも、クラウド プラットフォームは以前の仕事で覚えたものとは異なります。 あっという間に YAML ファイルの山に溺れ、簡単な Java サービスの構築が難事業になってしまいました。決めなければならないことがたくさんあります。コードの構成はどうしよう?継続的デリバリーにはどのツールを使用したらいいのだろう? DevOps モデルは開発者に耐えられないほどの学習の手間をもたらすこ

          道を照らす: プラットフォーム エンジニアリング、ゴールデンパス、セルフサービスのパワー | Google Cloud 公式ブログ
        • 巻頭言:SRE Magazineを始めました

          はじめまして、しょっさんと申します。 この度、SRE Magazine始めました。 何故始めたのかというと、国内においてSREについての情報が集まる場があまり無いなと思っていて、無いなら作っちゃえということで以下のツイートで寄稿者を募ってみました。 【!募集!】 SRE Magazineという"るびま"のようなWebマガジンを始めたいのですが、SREに関する記事を投稿してもいいよ!という方いらっしゃいますでしょうか?👀 内容はどんなものでも問題ありませんので、気になる方はDM等でご連絡ください!🙏 また、拡散もしていただけると助かります!🙇‍ — しょっさん@ʕ ◔ϖ◔ʔ (@syossan27) March 3, 2024 有り難いことに多くの方に反応頂けたことで「これは自分以外にも需要はありそうだな」ということで、走り始めました。 このTwitterで反応を伺ってから走り始めるの

            巻頭言:SRE Magazineを始めました
          • 新任・採用広報3ヶ月の仕事報告とふりかえり - ANDPAD Tech Blog

            こんにちは、 id:sezemi です。 今月リリース予定のアオアシ 34 巻とブルーロック 27 巻を楽しみに、それぞれ 1 巻からふりかえりをしている毎日です。 そんなことより勉強しよう、おれ。 さて、この記事は ANDPAD Advent Calendar 2023 4 日目と 技術広報 Advent Calendar 2023 シリーズ 2 の 4 日目の記事です。 9 月 1 日に採用広報としてアンドパッドに入社してから 3 ヶ月が経過したので、その仕事内容とふりかえりをします。 同じポジションにいらっしゃる方、もしくは興味がある方に、採用広報とはどんな仕事をしているのか、お伝えできればと思っています。 Who am I 改めて、自己紹介ですが、採用広告営業 3 年、技術書の出版社で技術研修サービスの立ち上げを行い、グループ企業に転籍後も同じドメインで様々な職種を経て 22 年働

              新任・採用広報3ヶ月の仕事報告とふりかえり - ANDPAD Tech Blog
            • ArgoCDバージョンアップを安全かつ迅速に行うための取り組み - freee Developers Hub

              概要 freeeではAmazon Web Services (AWS) Elastic Kuerbentes Service (EKS) 上にほとんどのアプリケーションが載っており、EKSへのデプロイ基盤としてはOSSの ArgoCD を利用しています。 ArgoCDから各クラスタにデプロイを行うため、非常に中央集権的なアーキテクチャとなっています。そのため、ArgoCDのバージョンアップは安全かつ迅速に行う必要があります。 本記事では、ArgoCDのバージョンアップの際に行っている取り組みをいくつか紹介します。 かなりマニアックですが、イントロダクションとまとめだけでも読んでいただければ幸いです。 イントロダクション 2023/04からfreeeでPlatform Deliveryチームに所属している gussan です。 Platform DeliveryチームはCI/CD全般のPla

                ArgoCDバージョンアップを安全かつ迅速に行うための取り組み - freee Developers Hub
              • 非エンジニア向け🍓開発生産性に関する研修をやってみた

                お疲れ様です。 レバテック開発部でDevRelを担当しているヤマモトヒロキです。 「月1本テックブログ執筆」を志しておりましたが、 GWの波に飲まれて4月執筆を逃してしまいました。人は怠惰な生き物です。 過去の記事はこちら。 やってみた 3行サマリ 仮説「開発生産性向上のキーファクターは、開発組織外にある」 「非エンジニア向けの開発生産性研修」をやってみた 研修設計の肝は①抽象概念インプット→②自社具体例→③理想行動の具体化 背景 現在私はDevRelやっておりますが、出自はマーケターで事業企画にキャリアの軸足を置いている、 ゴリゴリの非エンジニアです。 事業の責任者として事業を率いる立場と、 DevRelとしてイケてる開発組織を作り発信する立場の両方を経験したうえで、 「事業の継続的な成長と、開発生産性の維持向上の両立ほんと難しい~」 というあるあるな悩みと日々戦い続けている一人です。

                  非エンジニア向け🍓開発生産性に関する研修をやってみた
                • AWS WAFのログから特定Cookieの機密情報をKinesis Data Firehose + Lambda関数でマスクしてS3に保存するIaCをCDKで実装する - Qiita

                  AWS WAFのログから特定Cookieの機密情報をKinesis Data Firehose + Lambda関数でマスクしてS3に保存するIaCをCDKで実装するAWSwafaws-cdk AWS CDK Advent Calendar 2023の記事です。終わっても空いてた枠にシュルっと入りました。 NewsPicksのSREチームでセキュリティ周りも担当しているあんどぅといいます。 AWS WAFを利用する中で少しニッチな、しかし重要なロギングについてCDKで実装した例をご紹介します。 ボリュームが多いので、同じような構成でCDKを利用して実装する方の参考になれば幸いです。 WAFのログは重要。プライバシー保護も重要 同じアドカレ内でも書かれていますが、WAFを運用していると誤遮断がつきものなので、WAFのログは非常に重要です。 WAFのルールを適用する際は、COUNTモードで適用

                    AWS WAFのログから特定Cookieの機密情報をKinesis Data Firehose + Lambda関数でマスクしてS3に保存するIaCをCDKで実装する - Qiita
                  • なぜ、ゆるSRE勉強会をやりたいと思ったのか - もうずっといなかぐらし

                    こんにちは、かたいなかです。 おかげさまで、ゆるSRE勉強会は好評を頂いており、2/22に4回目の開催を迎えることとなりました。 yuru-sre.connpass.com これは、ひとえにイベントを盛り上げていただいている参加者の方や、開催場所等で協力いただいているスポンサー企業の皆様あってのことと思っております。 本当にありがとうございます。 ゆるSRE勉強会の開催に至った経緯や、これからの展望について盛り上がっているうちに記事してしまおうと思い、この記事を書き始めました。 ゆるSRE勉強会とは 開催したいと思った理由 SREとしてエンジニアを続けていく中で、あまり外向けに発表しづらい泥臭いことばかりやる期間がある フォーマルな雰囲気の大きな勉強会への踏み台となるような勉強会があまりない 開催に向けて ツイート 勉強会の設計 初回開催とその後 参加者の方々へのメッセージ ゆるSRE勉強

                      なぜ、ゆるSRE勉強会をやりたいと思ったのか - もうずっといなかぐらし
                    • Merpay & Mercoin Tech Fest 2023 セッション書き起こしまとめ | メルカリエンジニアリング

                      Merpay & Mercoin Tech Fest 2023は、事業との関わりから技術への興味を深め、プロダクトやサービスを支えるエンジニアリングを知ることができるお祭りで、2023年8月22日(火)からの3日間、開催しました。セッションでは、事業を支える組織・技術・課題などへの試行錯誤やアプローチを紹介していきました。 今回、より多くの方に知ってもらい役立ててもらうため、Merpay & Mercoin Tech Fest 2023の全セッションを書き起こした記事を用意しました。セッションがたくさんあるので、その記事リンクまとめを作成したのが本記事です。お役に立てば幸いです。 ▼Merpay & Mercoin Tech Fest 2023 書き起こし一覧 ※各記事にYoutubeのセッション動画が埋め込まれています。 Author Session Title Keynote Shun

                        Merpay & Mercoin Tech Fest 2023 セッション書き起こしまとめ | メルカリエンジニアリング
                      • SREとPlatform Engineerの交差点

                        Platform Engineering Meetup #5 #PFEM https://platformengineering.connpass.com/event/295048/ SREとPlatform Engineerの交差点: 2つの領域の交差と組織への適用 というタイトルで登壇します。 登壇ブログ |『SREとPlatform Engineerの交差点:2つの領域の交差と組織への適用』というタイトルで登壇しました https://syu-m-5151.hatenablog.com/entry/2023/10/05/233555 グレイラットの殺人 ワシントン・ポーが面白かったのでオススメです。 https://www.hayakawa-online.co.jp/shopdetail/000000015569/

                          SREとPlatform Engineerの交差点
                        • 「SRE入門:『SLO サービスレベル目標』監修者が解説する実践とメリット」 グーグル合同会社 山口 能迪 | Forkwell Press | フォークウェルプレス

                          「信頼性」を追求する新たな方法論として、Googleの副社長、Ben Treynor Slossが2003年に提唱したSRE(Site Reliability Engineering)は、開発と運用の両面における革新的なアプローチです。その理念は、2016年に出版された「Site Reliability Engineering: How Google Runs Production Systems」によって広く認識され、Amazon、Facebook、Airbnb、Dropbox、IBM、LinkedIn、Netflix、Wikimediaなど、世界的なテクノロジー企業がSREを採用し、もはやニューノーマルになっています。 SREを採用していない開発部署が必ずしも時代遅れとは言えませんが、SREの手法を取り入れることで、システム全体の信頼性とスケーラビリティをより効果的に管理できることは確

                            「SRE入門:『SLO サービスレベル目標』監修者が解説する実践とメリット」 グーグル合同会社 山口 能迪 | Forkwell Press | フォークウェルプレス
                          • Warningアラートを放置しない!アラート駆動でログやメトリックを自動収集する仕組みによる恩恵

                            SRE Next 2023 の発表スライドです

                              Warningアラートを放置しない!アラート駆動でログやメトリックを自動収集する仕組みによる恩恵
                            • 初めて登壇したら自信ついたからおすすめな件 - LIVESENSE ENGINEER BLOG

                              はじめに インフラGの鈴木です。土日はばんえい競馬を生で見て感動しましたが、馬券は全部外しました。 ばんえい競馬は馬が動くのに合わせて横を追走して鑑賞できます、本当に迫力がすごいです。競馬場グルメもおいしいですし、おすすめです。 ところで、先日勉強会で初めて登壇しました。今回はその登壇の様子を紹介します。 なぜ登壇したのか シンプルに目立ちたがり屋なので、昔から登壇したいと思っていました。 他には、過去に勉強会に登壇なしで参加した時、懇談会で他の人に話しかけるのがコミュニケーション力が必要で難しかったからです。なので登壇者の場合、話しかけるのも話しかけられるのもやりやすそうで、楽しそうだなと思ったのがあります。 登壇して得たこと まず自信がつきます。その次に言いたいことを明確化し、わかりやすく伝えるプロセスが鍛えられます。 LTは大体5分です。やってみるとわかりますが、5分で伝えられること

                                初めて登壇したら自信ついたからおすすめな件 - LIVESENSE ENGINEER BLOG
                              • さくらインターネット、生成AIのニーズに向けてNVIDIA H100 GPUのベアメタルクラウド「高火力 PHY」を発表 | IT Leaders

                                IT Leaders トップ > テクノロジー一覧 > サーバー > 新製品・サービス > さくらインターネット、生成AIのニーズに向けてNVIDIA H100 GPUのベアメタルクラウド「高火力 PHY」を発表 サーバー サーバー記事一覧へ [新製品・サービス] さくらインターネット、生成AIのニーズに向けてNVIDIA H100 GPUのベアメタルクラウド「高火力 PHY」を発表 2024年1月24日(水)日川 佳三(IT Leaders編集部) リスト さくらインターネットは2024年1月24日、生成AI向けベアメタルクラウドサービス「高火力 PHY(ファイ)」を発表した。同社の石狩データセンターで同年1月31日から提供する。生成AIの用途で需要が大きい「NVIDIA H100 Tensor コア GPU」をサーバー1台あたり8基搭載している。料金(税込み)は月額304万6120円(

                                  さくらインターネット、生成AIのニーズに向けてNVIDIA H100 GPUのベアメタルクラウド「高火力 PHY」を発表 | IT Leaders
                                • 小さいチームで実践する!開発速度・信頼性向上のためにやってよかったシステム改善3選 - dely Tech Blog

                                  こんにちは、クラシルリワードのSRE担当のjoooee0000です。 私はクラシルリワードのサービスローンチの約3ヶ月後にサーバー兼インフラエンジニアとしてjoinし、サービスの成長と共に、開発速度とシステムの信頼性の向上を目指してシステムの改善を行ってきました。 その中で、特に開発速度と信頼性向上に寄与したと思う3つの改善を紹介したいと思います。 改善を行う際に「コスト(金額、導入共に)と効果のバランス」「運用しやすいシンプルな設計」に特に気をつけたので、参考なると幸いです。 (話すこと: 取り組んだ施策の概要紹介、 話さないこと: 細かいhow to) やってよかったこと3選 ブランチ戦略の見直しとシンプルな検証環境の維持 ログの構造化とNewRelicログUIの導入 インシデント管理ツールの導入 それぞれ、改善前にどのような課題があったか、改善後のメリットなどを紹介していきます。 1

                                    小さいチームで実践する!開発速度・信頼性向上のためにやってよかったシステム改善3選 - dely Tech Blog
                                  • 第5回:TerraformとGitHub Actionsで構築するインフラCD - CADDi Tech Blog

                                    ※本記事は、技術評論社「Software Design」(2023年8月号)に寄稿した連載記事「Google Cloudで実践するSREプラクティス」からの転載です。発行元からの許可を得て掲載しております。 はじめに 前回はTerraformとGitHub Actionsで実践するインフラCI/CDのCI部分について解説しました。今回はその続きとなるCD部分、デプロイについて扱います。また、運用をよりスケールさせるために検討すべき観点やキャディでの事例についても紹介します。 terraform applyの実行 前回はPull request(PR)に対してterraform planを実行し、どのようなリソース変更が予定されているのかチェックしました。今回は、PRがマージされたらterraform applyを実行し、リソース変更が適用されるようなパイプラインを構築してみましょう。 リス

                                      第5回:TerraformとGitHub Actionsで構築するインフラCD - CADDi Tech Blog
                                    • メルペイのProgram型組織への移行 | メルカリエンジニアリング

                                      はじめに こんにちは。メルペイVPoEの@keigowです。 この記事は、Merpay Advent Calendar 2023 の2日目の記事です。 今年の3月まではソウゾウでHead of Engineeringとして働いていましたが、4月にメルペイに2年ぶりに戻ってきました。本日はメルペイのProduct組織の改善とProgram組織への移行の取り組みについてご紹介します。 以前のProject Matrix型組織 2022年9月までは、Microservicesの単位をベースとして構成されたFunctionチーム(Growth、Platform、与信領域など)から、3ヶ月ごとに決めているProject(新機能開発、他社連携など)に各メンバーをアサインしていくという形でProduct開発を推進していました。 会社のOKRとして合意した目標に沿って、Productチーム内でProjec

                                        メルペイのProgram型組織への移行 | メルカリエンジニアリング
                                      • エンジニアらが明かすAWSコスト削減術 「月額約6万ドル削減」の裏側

                                        オンプレミス環境に比べ、柔軟で迅速に導入でき、かつコスト面でも有利――こうした理由から、この数年、クラウドファースト、クラウドシフトが広がっている。 だが、順調にサービスが成長し、支える基盤が拡大するにつれ、「あれ、思ったよりもずいぶんコストがかさんでない?」と疑問を抱く場面もあるのではないだろうか。 2024年2月に開催されたAmazon Web Services(AWS)のコスト削減をテーマとするイベント「第1回 AWSコスト削減 天下一武道会」には、3000人を超える申し込みがあった。同イベントを企画した西谷圭介(@Keisuke69)氏は「クラウドのコスト削減は最近とてもホットなテーマですし、終わりのないテーマでもあると思います」と述べ、登壇者らのアプローチを参考にして、コスト削減のヒントを手にしてほしいと呼び掛けた。 コスト削減は総力戦のお祭り、楽しんで取り組みを イベントのトッ

                                          エンジニアらが明かすAWSコスト削減術 「月額約6万ドル削減」の裏側
                                        • PagerDutyを用いたアラート対応改善の取り組みとTips紹介 - freee Developers Hub

                                          はじめに こんにちは!freee の Enabling SRE チームに所属している阿部 寛明 (uryy)と申します。freeeのシステムを運用する際にはDatadogからの通知をもとにアラート対応するケースが多いのですが、組織拡大により従来の方法ではうまくワークしない箇所もでてきたので改善に取り組んでおります。今回はその一環で進めているPagerDuty導入の取り組みとその際に気づいたTipsについて紹介します。 PagerDutyについて PagerDutyは監視ツールやアプリケーションからのアラートを受けてインシデント発生を担当者にオンコール通知するプラットフォームサービスです。オンコール機能だけでなく、受け取ったアラートのトリアージやシフトに基づいたエスカレーションも可能となっています。freeeでは下記図のようなシステム連携の環境構築を進めています。 システム連携イメージ 現在

                                            PagerDutyを用いたアラート対応改善の取り組みとTips紹介 - freee Developers Hub
                                          • 「君が欲しい」と言わせる情シス資格 キャリアチェンジ向きの資格も解説

                                            情シスの方から「スキルアップや評価アップ、給与アップに備えて何の資格を取ればよいのか」という質問を多く頂きます。また、他の職種から情シス、情シスから他職種へのキャリアチェンジを考えている方は「どのような資格を取得すれば優位に振る舞えるか」が気になるでしょう。 今回は情シスのキャリアパスで効果的な資格や、キャリアチェンジでお勧めの資格を解説します。 そもそも情シスにとって資格は必要か? 大前提として情シスに資格が必要かどうかについてお話をします。 企業によっては、資格がなくても職務経歴書にしっかりとした取り組みや経験したエピソードがあれば選考を通過できます。どんなに資格を持っていても、実務経験に重きを置いて採用する企業もあります。資格を持ち過ぎている場合は「実務経験の少ない資格コレクターではないか?」と警戒され選考が厳しくなるような、実務能力しか信じない野武士のような集団もあります。 ただ一

                                              「君が欲しい」と言わせる情シス資格 キャリアチェンジ向きの資格も解説
                                            • LayerXとMDMの異なる魅力とチャレンジ as コーポレートシステム - LayerX エンジニアブログ

                                              始めに LayerXにはFintech事業部門があり、所属社員は三井物産デジタル・アセットマネジメント(以降、MDM) に出向しています。 今日はこのFintech事業部門・MDMのCTO室的存在について、スポットを当てたいと思います。 それぞれにセキュリティとコーポレートシステム機能をもつ部門が存在していますが、基本的には同じ方針、同じ優先順位でことに当たっていました。 それは何故でしょう? 身も蓋もないことをいうと、それぞれにおいて創業間もない時期から、私という同一の人間が兼任していたからです しかし、新たにLayerXのCTO室長(※)も迎えた今のステージにおいては、それぞれが目指す方向性にやや違いができてきました。 本ブログでは、その違いを、事業の特性、横断組織の関与の深さ、組織構成に基づき、明確にしようと試みるものです。 ※「未来の“当たり前”を作る」セキュリティ・SREのスペシ

                                                LayerXとMDMの異なる魅力とチャレンジ as コーポレートシステム - LayerX エンジニアブログ
                                              • Kafka Streams の State Store が tombstone によって遅くなってしまったので RocksDB のパラメータを調整してみた話 - Repro Tech Blog

                                                Platform Team の Repro Core という Unit に所属している村上と申します。 Repro Core の役割の 1 つとして、共通基盤となる Kafka Streams アプリケーションの運用があります。 この共通基盤は Repro の大量トラフィックを捌いている基盤になるため、日々の運用の中で様々な課題に直面します。 今回はそのような課題の中から、tombstone によって State Store のパフォーマンスが低下し、その解決策として RocksDB のパラメータを調整した話をします。 前半部分では tombstone によって State Store のパフォーマンスが低下した件を説明します。後半は RocksDB の compaction の挙動確認とそのパラメータ調整について説明します。 ちなみに、私が所属している Repro Core については、

                                                  Kafka Streams の State Store が tombstone によって遅くなってしまったので RocksDB のパラメータを調整してみた話 - Repro Tech Blog
                                                • やさしいクリーンアーキテクチャ

                                                  SREホールディングス株式会社の松本です。 プロダクトはリリースしてからが始まりで開発し続けることが当たり前の時代、ソフトウェアは変更や拡張に強く設計しなければなりません。クリーンアーキテクチャはそんな設計を実現する方法の1つですが、名前は聞いたことはあるけど実践したことはない、なんだか複雑で難しそう、という印象を持っている人が多いのではないでしょうか。 クリーンアーキテクチャを詳細に説明している記事は数多くありますので、本記事ではクリーンアーキテクチャを触ったことがない方に良さが伝わるように、やさしく噛み砕いて説明してみようと思います。 対象読者 クリーンアーキテクチャをこれから学びたい方 クリーンアーキテクチャとは 機能を実現しているコアな部分をフレームワークやDBなどに依存しない状態(関心事の分離)にすることで、他が変わってもコアな部分への影響をなくし、変更や拡張に強くすることができ

                                                    やさしいクリーンアーキテクチャ
                                                  • 技術に興味がないけどエンジニアやってます - Qiita

                                                    はじめに 私はITエンジニアの仕事が好きです。結構楽しんで仕事をしています。 不器用な私でも自分で手を動かして課題解決できるのが嬉しいし、様々な制約条件の中で要件をどう実現するのか考えるのが楽しいです。保守性を考えてどのように実装するか考えるのも好きです。 ブリッジやマネジメント、PMがやりたいわけではなく、開発業務が楽しいです。 一方で私は技術に興味がありません。恥ずかしながら以下のようなことはやったことがありません。 休日に個人開発 最新動向のチェック 技術記事の執筆(社内での発信くらいはやる) エンジニアイベントへの参加 やっていることは以下くらいです。 業務で必要になった技術のリファレンスや記事を読み漁る 必要に応じて技術書読む X(Twitter)や社内Slackで流れてきた技術記事読んでみる ハンズオンは大の苦手なので基本読んで理解するだけで手を動かすのは基本業務の中です。 休

                                                      技術に興味がないけどエンジニアやってます - Qiita
                                                    • OpenTelemetry Collector 自身のモニタリングについて考える - 株式会社ヘンリー エンジニアブログ

                                                      ヘンリーで SRE をやっている id:nabeop です。最近の仕事のテーマはサービスの可観測性の向上と信頼性の計測です。 最近では可観測性の文脈では OpenTelemetry が話題に上がると思いますが、ヘンリーでも OpenTelemetry を導入してテレメトリデータを収集して、各種バックエンドに転送しています。分散トレース周りの話題については、以下のエントリがあります。 ヘンリーではマイクロサービスからのテレメトリデータは Cloud Run で構築した OpenTelemetry Collector で集約し、otelcol のパイプライン中で必要な処理を実施し、バックエンドに転送するアプローチを採用しています。 OpenTelemetry Collector でテレメトリデータを収集している様子 現在は監視基盤の移行期なので、メトリクスが Google Cloud と Da

                                                        OpenTelemetry Collector 自身のモニタリングについて考える - 株式会社ヘンリー エンジニアブログ
                                                      • Terraform コードリーディング会を開催し、エンジニア組織全体でインフラの知識の底上げができた話 - メドピア開発者ブログ

                                                        SRE の田中 @kenzo0107 です。 Terraform コードリーディング会を実施した結果、 エンジニア組織全体でインフラの知識の底上げができた話です。 何故やることになったか? 弊社では以下のような背景がありました。 SRE チームが基本インフラ管理 会社の成長に比例し管理するインフラが増加⤴️ SRE チームの処理能力が頭打ちにとなる未来が予想され、 インフラ管理は以下体制への移行が求められていました。 上記の体制へ移行活動の一環として、 まず 「Terraform を知る」こと、ひいては 「AWS を知る」きっかけを作るべく、 Terraform コードリーディング会を開催することとしました。 勉強会の頻度や基本方針 週 1 回 30 分 × 15~6 回*1 自身の携わるプロジェクトの勉強会に参加*2 構成図を元にコードを読む範囲の構成を定める 以下を見ながら、設定の意味

                                                          Terraform コードリーディング会を開催し、エンジニア組織全体でインフラの知識の底上げができた話 - メドピア開発者ブログ
                                                        • primeNumberさんと合同勉強会を開催しました! - KAYAC engineers' blog

                                                          こんにちは。人事部の高田です。 2023年10月20日、primeNumberさんと合同で勉強会を開催しましたので、その様子をご報告します。 primeNumberさんとは2022年12月にも合同で勉強会を開催させていただきました。 イベントの内容 イベントタイトルは 「組織拡大と共に発生するソフトウェア品質の課題と裏話LT」 です。 簡単に言うと、長期的にサービスやシステムが運用される中で発生する課題や、いわゆる「技術的負債」に関する各社の知見を共有するための会でした。 発表内容 登壇者とトークテーマは下記の通りでした。 発表者 所属 タイトル 鈴木さん primeNumber インシデントの重大度レベル(SEVレベル)策定の話 元木 カヤック Railsでスピード重視で立ち上げたプロダクトの数年後あるある集 中根さん primeNumber 自動化テストをほぼ0 -> 1で社内に浸透さ

                                                            primeNumberさんと合同勉強会を開催しました! - KAYAC engineers' blog
                                                          • マルチテナンシーのKubernetesクラスタとサービス間通信の認可

                                                            こんにちは、LINEヤフー株式会社でSREとして働いている岩山です。 今回は出向先の出前館で進めているマルチテナンシーのKubernetes(k8s)クラスタとサービス間通信の認可について、その構築作業の中で得られた知見を紹介します。 いくつか導入したツールの紹介を同じチームの出向組メンバーである岡田・望月・岩山の3名でお送りします。 k8sのマルチテナンシーとは マルチテナンシーとは「テナント」と呼ばれる複数のチームなどの単位で k8s クラスタを共有することです。 参考: https://kubernetes.io/docs/concepts/security/multi-tenancy/ 出前館では数百名の開発者が20個前後のチームを構成し、アプリケーションの開発を行っています。それぞれのチームは複数のコンポーネントを持ち、全体としてマイクロサービスアーキテクチャが構成されています。

                                                              マルチテナンシーのKubernetesクラスタとサービス間通信の認可
                                                            • EKSのノードをGravitonに変えました - Chatwork Creator's Note

                                                              SRE部の坂本です。 ChatworkはほぼすべてのアプリケーションをEKSで動かしています。そのEKSのノードは90%以上をSPOTインスタンスで動かしているので、i系インスタンスで動かしている状態でも、規模(日中で150ノード程度)の割には比較的安価に動かせている状態でした。 しかし円安だったり、通常のWebアプリケーションではそもそもGravitonのほうがパフォーマンスがいいらしい、など、インスタンス単体でのコストダウン + αのメリットを期待して、Gravitonへ移行することとしました。 SPOTインスタンスで稼働しており、かつ、Gravitonのインスタンスの種類が少ない状態では、Graviton移行へのモチベーションがあまり上がりませんでしたが、Gravitonのインスタンスの種類が増え、GravitionのSPOTインスタンスも安定してきた、とのことで、今回の移行に踏み切

                                                                EKSのノードをGravitonに変えました - Chatwork Creator's Note
                                                              • エンジニア採用経験者が、フリーランスエンジニア向け案件紹介会社の面談で意識しているポイント4選 | DevelopersIO

                                                                プロパゲート株式会社の本間です。 プロパゲート株式会社では、フリーランスのエンジニア向けに案件紹介を行うCMパートナーズという事業があります。 CMパートナーズでは、フリーランスのエンジニアさんがスキルシートを提出した後、そのエンジニアさんが どのような経験を積んでいる方なのか? どのような条件&業務を行いたい方なのか? 事業会社に対して、どのような方として紹介すればよいのか? の確認を行う初回面談プロセスがあり、その初回面談にAWSエンジニア&エンジニアリングマネージャー経験者である私も同席することがあります。 今回はそのフリーランスのエンジニアさんとの初回面談を行う際に、一般的なエンジニアの従業員採用面接と視点が異なる部分を感じたため、私が心がけていることをいくつかピックアップして書いてみたいと思います。 1.どのような経験を積まれてきたか? プロパゲートは案件紹介会社である以上、エン

                                                                  エンジニア採用経験者が、フリーランスエンジニア向け案件紹介会社の面談で意識しているポイント4選 | DevelopersIO
                                                                • Unleash Mercari Tech! vol.4 〜メルペイ立ち上げ当時に戻ったら?〜:メルカリ技術書典部

                                                                  本書は「今の知識を持ったまま、メルペイ立ち上げ当時に戻るとしたらどうしてたか?」をテーマとして社内でインタビューを行い、それをまとめた部誌です。 技術選定の話やメルペイ立ち上げ当時の話など、それぞれがとても濃い内容となっているので、非常に読み応えのある本になっています。 ぜひ、楽しんで読んでもらえるとうれしいです! - 目次 - 第1章 Payment Platform編 第2章 iOS / Android編 第3章 Engineering Manager編 第4章 Platform Engineering編 第5章 SRE編 第6章 Architect編 第7章 元メルペイCTO編 今回の表紙は猫ちゃんたちです。かわいいですね!

                                                                    Unleash Mercari Tech! vol.4 〜メルペイ立ち上げ当時に戻ったら?〜:メルカリ技術書典部
                                                                  • 障害対応入門記事まとめ〜システム運用担当者になったらまず読むべき記事を厳選!〜|インシデント管理プラットフォーム│PagerDuty

                                                                    本記事では、主に新しくインシデント対応・管理を担当することになった皆様に向けて「インシデント対応者になったら、まず把握すべきこと」をテーマにPagerDuty公式ブログの中から入門記事を厳選してご紹介します。新人のインシデント対応者の方はもちろん、基礎的な部分の学び直しなどにもお役立て頂けますと幸いです。今後、関連記事が公開次第順次更新していきます。 ブックマークおすすめです! 概念理解編1️⃣ システム障害とは?〜企業が考えるべきリスク対策とインシデント管理〜企業にとって甚大な損失とともに伝えられるシステム障害のニュースを耳にすると、自社のシステム障害対策に不安を覚える方もいるのではないでしょうか。現代のシステム障害対策では、予防策に加え、より迅速な障害対応が求められます。システム障害が発生すると大きな損失につながり、1分1秒でも早い復旧が望まれるためです。そこで、システム障害の対策と対

                                                                      障害対応入門記事まとめ〜システム運用担当者になったらまず読むべき記事を厳選!〜|インシデント管理プラットフォーム│PagerDuty
                                                                    • "何かうまくいってない" 開発組織でよく見る光景と打開策がまとまった「システム運用アンチパターン」を読んだ - kakakakakku blog

                                                                      「システム運用アンチパターン」を読んだ❗️ サブタイトルに「エンジニアが DevOps で解決する組織・自動化・コミュニケーション」と書いてある通り,迅速に改善を積み重ねつつサービスの価値をユーザーに提供するときに,どういう組織の振る舞いが「悪くて」どういう組織の振る舞いが「良いか」というアプローチを DevOps 視点で学べる良い一冊だった📕 システム運用アンチパターン ―エンジニアがDevOpsで解決する組織・自動化・コミュニケーション 作者:Jeffery D. SmithオライリージャパンAmazon 個人的に本書が特に刺さりそうだなーと思った読者層は,比較的レガシーな開発組織にいて「何かうまくいってない」や「何となく今のままではダメそう」とは思うけど,具体的にどう改善したら良いかというアイデアは浮かんでこないような開発責任者や肩書に関係なくもっと良い組織にしたいと感じているエン

                                                                        "何かうまくいってない" 開発組織でよく見る光景と打開策がまとまった「システム運用アンチパターン」を読んだ - kakakakakku blog
                                                                      • Workload Identity 連携を利用して GitHub Actions を動かす

                                                                        こんにちは、SREディビジョンの松島です。 この記事では Workload Identity 連携の機能紹介と、GitHub Actions から Google Cloud を操作するハンズオンを行います。 Workload Identity 連携とは 外部のワークロードに対して Google Cloud のサービスアカウントの権限を利用させることができる機能です。 AWSや、OpenID Connect、SAML 2.0 について Workload Identity による ID の連携が可能となっています。 Workload Identity 連携のいいところ サービスアカウントキーを発行せずに外部のワークロードに対して Google Cloud の操作を行わせることができる点が良いところです。 サービスアカウントキーは発行自体が認証情報の漏洩機会の増加などにつながるなど、ベストプラク

                                                                          Workload Identity 連携を利用して GitHub Actions を動かす
                                                                        • 本選のみ開催のISUCON13、問題はどう変わる? 作問チームが語る”問題に込めた思い” - #FlattSecurityMagazine

                                                                          Webアプリケーションのチューニングコンテスト「ISUCON13」が、いよいよ2023年11月25日(土)に開催されます。 サイバーセキュリティスタートアップのFlatt Securityは、今回ISUCON13にメディアスポンサーとして初協賛。プロダクト開発コミュニティにおける国内最大級のイベントであるISUCON13を盛り上げるべく、#FlattSecurityMagazineにて、ISUCON13の見どころやISUCONの魅力を発信していきます。 予選はなく、本選のみの一本勝負となるISUCON13。問題構成や内容に変化はあるのか、注目が集まっています。問題作成に携わる、さくらインターネット株式会社の長野雅広さん、穎川和弘さん、菅原大和さんの3人に、ISUCONに関わり始めたきっかけや作問の裏側、ISUCON13の”傾向と対策”についてお話を伺いました。 プロフィール 長野雅広さん

                                                                            本選のみ開催のISUCON13、問題はどう変わる? 作問チームが語る”問題に込めた思い” - #FlattSecurityMagazine
                                                                          • 4/24 オンライン開催!Hatena Engineer Seminar #29「障害対応編」 - Hatena Developer Blog

                                                                            こんにちは。CTO の id:motemen です。 2024年4月24日(水)に Hatena Engineer Seminar #29 「障害対応編」を開催しますので、お知らせします。 はてなに所属するエンジニア3名が「障害対応」をテーマに、これまでの取り組みやそこでの学びについて発表します。 開催はオンラインです。(詳しくはconnpassのイベントページをご確認ください)。皆様のご参加をお待ちしております! イベント概要 日時: 2024年4月24日(水) 13:00-13:50(予定) 参加費: 無料 開催形式: オンライン配信 YouTube Live YouTube Live HatenaTech チャンネルにて https://www.youtube.com/channel/UCwqsFJGxzAZQdcT1xYZhhbw 開催当日に connpass に登録されているメー

                                                                              4/24 オンライン開催!Hatena Engineer Seminar #29「障害対応編」 - Hatena Developer Blog
                                                                            • ZOZOTOWNの企画LPをアーカイブする! - ZOZO TECH BLOG

                                                                              目次 目次 はじめに 企画LPの儚さ 企画LPをアーカイブする! 仕様 開発について 技術選定 ちょっと技術の話 スクラム開発 ユーザーの反応 おわりに はじめに こんにちは! ZOZOTOWN企画開発部・企画フロントエンド1ブロックの秋山です。ZOZOTOWNトップでは、セール訴求や新作アイテム訴求、未出店ブランドの期間限定ポップアップ、著名人コラボなどの企画イベントが毎日何かしら打ち出されています。私はそのプラットフォームとなる企画LPをメインに実装するチームに在籍しています。 チーム特性としては以下のようなものがあります! クリエイティブコーディング寄りの実装をする機会に恵まれやすい 普段のLP案件内では、エンジニアよりも他職種(デザイナー、PM、ビジネス職)と連携することが多い 企画LPの儚さ 定常的なページと違って、開催期間が定まっている企画LPの命は儚いものです。月に20本ほど

                                                                                ZOZOTOWNの企画LPをアーカイブする! - ZOZO TECH BLOG
                                                                              • QAエンジニアでLT大会をしてみた - freee Developers Hub

                                                                                こんにちは、QAのharashinです。 先日QAチームでチーム内LTを実施しました! QAチームでLTをしようと思った理由は大きく2点あります 1. 組織拡大していく中で他のチームの取り組みやペインの言語化・可視化 QAチームは横断的な組織でQAチームには属していますが 普段はそれぞれの担当プロダクトチームと一緒に業務をしています。 「QAのスキルアセスメントシートを作って適用してみた」でもあるように、現在社内では 「QAのテストの標準化」 がされています。 ただ「QAのテストの標準化」 でフローは標準化されていても、 プロダクトの特性やチームの開発体制によってテストの内容や取り組みなど異なる部分が出てきます これまでオフィスでの雑談や組織の規模感から、 なんとなくでも他のチームの状況が把握できていましたが、 ここ最近の急激な組織拡大により他のチームの状況が把握しづらくなっている現状があ

                                                                                  QAエンジニアでLT大会をしてみた - freee Developers Hub
                                                                                • YAPC::Hiroshimaに参加と登壇した #yapcjapan #yayapc - 記

                                                                                  2024/02/09 ~ 2024/02/11に開催されたYAPC::Hiroshimaの一連のイベントに参加してきました。 所属しているBASE株式会社としてスポンサーしているのその兼ね合いで。 久々にブログ作ると思ってみたらドメインがhatenadiaryでした、マジ? yapcjapan.org 各種セッション YAPC前夜祭 Introduce Hono v4!!!! Hono v4リリースについて ミニマルなFWなのは知っていたが具体を聞いて使いたい気持ちが増した。 ミニマルさを維持しつつフルスタックになっていくのは大変だろうけど凄いな〜っていう感想。 社内のメンテされてないRailsを置き換えようかなって気持ちになっている、ORM周りだけどうしようか悩みどころ。 Cache-Control: max-age=86400 みんな大好きCacheの話。 キャッシュは麻薬という言葉が

                                                                                    YAPC::Hiroshimaに参加と登壇した #yapcjapan #yayapc - 記