並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 52件

新着順 人気順

SREの検索結果1 - 40 件 / 52件

  • 技術的負債を抱えたレガシーコード。変なメソッド名と入り組んだロジック、リファクタリングするならどちらが先?(後編)

    技術的負債を抱えたレガシーコード。変なメソッド名と入り組んだロジック、リファクタリングするならどちらが先?(後編) ソフトウェアの品質をテーマに研究をしている名古屋大学 森崎研究室は、ソフトウェアの技術的負債をなんらかの形で数値化する手法の研究の一環として、コードの読みにくさの原因となる要因などを分析した研究結果を発表するイベントをオンラインで開催しました。 この記事ではそのダイジェストを紹介します。記事は前編と後編の2つに分かれています。今お読みの記事は後編です。 森崎氏による補足説明 前編では、グループA(命名的問題)より、グループB(構造的問題)の方が正答率が大きいということ。一方でグループA(命名的問題)よりグループB(構造的問題)の方が読みにくさを感じた、という点に統計的に有意な差があったことが発表されました。 発表の後、オンラインイベントの参加者からの質問について森崎氏と和田氏

      技術的負債を抱えたレガシーコード。変なメソッド名と入り組んだロジック、リファクタリングするならどちらが先?(後編)
    • 開発チームとともに進めるインフラセキュリティの継続的な改善 / SRE Lounge 17

      2024年7月2日に開催された SRE Lounge #17 の発表資料です。 SRE Lounge #17(ハイブリッド開催) - connpass https://sre-lounge.connpass.com/event/321335/ このプレゼンの技術的な詳細は、過去のブログ記事…

        開発チームとともに進めるインフラセキュリティの継続的な改善 / SRE Lounge 17
      • OpenSSH の脆弱性について

        こんにちは、クラウドエースの SRE チームに所属している妹尾です。 今回は OpenSSH の脆弱性についての記事です。 (この記事は 7/4 に速報版から正式版へ更新しました) 2024/07/02 に、CVE-2024-6387が発表されました。 これは放置しておくと SSH を受け付ける全てのサーバーを乗っ取る事ができてしまう脆弱性です。 厄介なことにデフォルト設定の SSH-Server と、ある程度の時間があればサーバーを乗っ取れてしまうので、緊急度もかなり高めになっております。 そして Compute Engine もこの影響を受ける ので、多くの環境で対策が必要となります。 結局どうすればいいの Google が公表している、 GCP-2024-040 の手順に従いましょう。 (日本語訳ページだとまだ公表されてないようですので、英語版を見てください) 具体的には、以下のよう

          OpenSSH の脆弱性について
        • 開発者が安心して実行可能なSQL実行基盤の導入と運用 #ベッテク月間 - LayerX エンジニアブログ

          こんにちは!バクラク事業部 Platform Engineering 部 DevOps チームの id:sadayoshi_tadaです。 7月はエンジニアブログがたくさん出る #ベッテク月間です。今後も記事が出ますので、どんな記事がでるのかこちらのカレンダーからよければチェックしてみてください!7/2にSRE Lounge#17にて開発者が安心して実行可能なSQL実行基盤の取り組みという発表させていただきました。この記事では当該発表で時間の関係で触れきれなかった内容や補足を行っていきます。 従来のデータベースのデータ変更における課題 課題に対する解決策の検討 Bytebaseの利用にかかるコスト Bytebaseの導入及びデータ変更のフロー整備 データ変更のフロー整備 Bytebase導入後の変化 データ変更オペレーション上の課題 まとめ 最後に 従来のデータベースのデータ変更における課

            開発者が安心して実行可能なSQL実行基盤の導入と運用 #ベッテク月間 - LayerX エンジニアブログ
          • 大規模サービスの負荷試験を改善していった話

            こんにちは!株式会社COMPASSのシステム開発部、SREチームのごーすと(@5st7)です!普段は、k8s周りの運用であったり、アプリケーションのパフォーマンスの監視、改善、インフラ周りの自動化などを積極的に進めています。三度の飯よりも好きなものがプリンで、美味しいプリンの店とかが流れてきたら1営業日以内に馳せ参じます。プリン好きな人はお店で会いましょう。 今日は負荷試験の取り組みについてご紹介できればと思います。COMPASSが提供するキュビナは現在100万人を超えるユーザーに利用していただいていますが、その分トラフィックも大きく、安定してサービスを提供できるようにするために、様々な工夫をしています。その中でも利用の集中する時間帯の負荷に耐えられるかの検証は非常に重要な取り組みの一つです。今回は、COMPASSが今まで負荷試験にどのように取り組んできたのか、その歴史と改善を行っていった

              大規模サービスの負荷試験を改善していった話
            • 『家族アルバム みてね』はRuby 3.3で動いています

              こんにちは、みてねプロダクト開発部 プラットフォームグループ SREチームの kohbis です。 『家族アルバム みてね』(以下、みてね)では、ほとんどのサーバーサイドをRuby on Railsアプリケーションで展開しています。 そしてタイトルの通りですが、2024年6月時点でみてねのアプリケーションのすべてにおいてRuby 3.3.3へのアップグレードが完了したので、その結果について紹介したいと思います。 Ruby 3.3アップグレードの結果以下はみてねの主なAPIを提供しているアプリケーションのグラフ(平均)です。 Ruby 3.3リリースのタイミングで大幅にレスポンスタイムが改善していることがわかります🙌 Ruby 3.3へのアップグレードでおおよそ10%の速度改善を得られました。 グラフにはありませんがp95やp99も同様の割合、つまり速度としてはより大幅な速度改善にいたって

                『家族アルバム みてね』はRuby 3.3で動いています
              • ヘンリーのオブザーバビリティ成熟度を考える - 株式会社ヘンリー エンジニアブログ

                sumirenです。 ヘンリーではオブザーバビリティに投資をし、開発生産性と品質を高める取り組みをしています。 この記事では、ヘンリーが考えるオブザーバビリティ成熟度を解説し、最後にヘンリーの現状と今後について解説します。 オブザーバビリティ成熟度 全体像 筆者は、オブザーバビリティの成熟度について、以下のように考えています。 これはあくまで一般的な概念ではなく、筆者が説明のために考えた便宜上のモデルになります。 なにもない インフラメトリック アプリケーションログ 非構造化ログ 構造化ログ リクエストに紐づくログ アプリケーションメトリック(ログベース) トレース トレース単体 システム固有の共通的な計装 ドメイン/機能カットの計装 トレースの分析と集計 トレースの相関分析 オブザーバビリティ成熟度が低い状態〜中程度の状態 1. なにもない〜 2. インフラメトリック なにもない状態は、

                  ヘンリーのオブザーバビリティ成熟度を考える - 株式会社ヘンリー エンジニアブログ
                • Amazon SESで受信したメールをRedashで検索できるようにしてみた - Nealle Developer's Blog

                  こんにちはSREチームの宮後(@miya10kei)です。最近、テレビ📺からプロジェクター📽️に乗り換えて大満足しています🤗 みなさんのサービスでは送受信したメールの検索はどうしてますか? サービスを運用していると「メールが届いてない」という問い合わせを受けることはあるあるではないかと思います。今回は送受信したメールを永続化し、検索できるようにした仕組みを紹介します。 背景 Park Directでは日々多くのメールを送受信しており、業務上メールはとても重要な要素になっています。また、システムにも貸主様と借主様がメールのやり取りをする機能があるため、メールが届いていない、UIに表示されないなどの問い合わせが一定の頻度で発生しています。その問い合わせはサクセスチームだけで調査が完結せず、サクセスチームから依頼された開発チームで調査が行われています。そのため、メールの送受信状況をサクセス

                    Amazon SESで受信したメールをRedashで検索できるようにしてみた - Nealle Developer's Blog
                  • ECSプロダクトの監視をTerraform Moduleで標準化

                    自己紹介 はじめまして、ENECHANGEの@rubita_isi です。 普段はWEBアプリケーションのバックエンドやインフラの開発や運用を担当しています。 この記事では、AWS上に構築された膨大なWEBアプリケーションをElasticBeanstalkからECSに移行する際に、 監視をTerraform Moduleで標準化した件について、その背景や具体的な内容についてお話しします。 ECS移行について ElasticBeanstalkからECSへの移行 ENECHANGEでは、WEBアプリケーションをAWSのElasticBeanstalkで運用していました。 しかし、ElasticBeanstalkを利用する場合、ホストOSやアプリケーション言語のバージョンが頻繁にサポート終了を迎え、その度に対応が必要でした。 また、ebextensionやplatform hookの仕組み・仕様

                      ECSプロダクトの監視をTerraform Moduleで標準化
                    • スクラムチームをLeSSっぽく2分割したらリリース頻度が2倍になった話 - NTT Communications Engineers' Blog

                      時系列データ分析ツール「Node-AI」を開発するスクラムチームは、LeSS(Large-Scale Scrum)を参考にした開発プロセスを採用しました。 本記事では、その背景や数か月試した結果について紹介します! 目次 目次 はじめに Node-AIについて フロントエンドのリプレイスを終えて チーム分割に対する勘所 コンポーネントチームとフィーチャーチーム 実際の運用 チームへの愛着 2チーム体制を続けてきて おわりに はじめに はじめまして、イノベーションセンター Node-AIチームの中野、半澤です。 (中野)Node-AIチームでは2024年4月からスクラムマスターとして活動しております。 過去には研究者やデータサイエンティスト、ソフトウェアエンジニアなど幅広くジョブチェンジして今に至ります。 中野 将尚 | LinkedIn (半澤)Node-AIチームでは開発者としてインフラ

                        スクラムチームをLeSSっぽく2分割したらリリース頻度が2倍になった話 - NTT Communications Engineers' Blog
                      • 開発者が安心して実行可能なSQL実行基盤の取り組み/Initiatives for a Secure SQL Execution Platform for Developers

                        SRE Lounge#17で発表した資料になります。

                          開発者が安心して実行可能なSQL実行基盤の取り組み/Initiatives for a Secure SQL Execution Platform for Developers
                        • 003号(2024/07/01)

                          巻頭言:一人SREsのドキュメンテーション実践 書いた人:しょっさん( @syossan27 ) 一人でSRE活動をやっている中で実践しているドキュメンテーションに関するTipsと、最後に来年開催致しますSRE Kaigiの話を少しいたします。 ECSプロダクトの監視をTerraform Moduleで標準化 書いた人:@rubita_isi ECSプロダクトの監視をTerraform Moduleで標準化した件について、その背景や具体的な内容についてお話しします。 入門 ポストモーテム 書いた人:渡部龍一( @ryuichi_1208 ) ポストモーテムを行う流れとその際に気を付けていることなどについて書きました。 AWS Cost and Usage ReportsをSnowflakeからクエリする 書いた人:@ohsawa0515 AWSコストを分析・可視化するためのAWS Cost

                            003号(2024/07/01)
                          • Techouse社内勉強会の内容を紹介します(1) データベース<ACID編> - Techouse Developers Blog

                            Techouseの「エンジニア基礎勉強会」とは Techouse では「基礎勉強会」と称して2週間に1回、わたしが OS・ネットワーク・データベース・ハードウェア・セキュリティ・システムアーキテクチャなどをお話する勉強会を開催しています。 講師は私ひとり、資料を準備するのも私ひとり、動画を収録して YouTube Live で社内向けに配信する作業も私ひとりでやってます。 参加は任意ですが、社内のメンバー (社員・インターン生・業務委託でご参画いただいている方) の多くの方が参加してくれています。先日の RubyKaigi 2024 に参加してくれたメンバーもほとんどがこの勉強会に参加し、基礎的な知識をもった上でセッションへ臨んでくれました。 開催履歴 これまでの開催履歴はこんな具合です。 見ていただくとわかる通り、ほんとうに基礎的な内容を1個ずつやっているということがわかるかと思います。

                              Techouse社内勉強会の内容を紹介します(1) データベース<ACID編> - Techouse Developers Blog
                            • AWS Cost and Usage ReportsをSnowflakeからクエリする

                              はじめまして、クリエイティブサーベイ株式会社の大澤(@ohsawa0515)と申します。 Sansan株式会社でITインフラエンジニアとデータエンジニアをした後、2024年1月からグループ会社のクリエイティブサーベイに出向して、SREチームのかたわら、データエンジニアチームにEmbedded SREとしても活動しています。 AWSのコストを分析・可視化する場合に、AWS Cost Explorerを使うことが一般的ですが、より詳細な分析を行う場合にはAWS Cost and Usage Reports(AWSのコストと使用状況レポート、以下CUR)を利用することがあります。CURはS3バケットにCSVもしくはParquet形式の請求データを定期的に出力する機能で、Amazon AthenaやAmazon Redshift、Amazon QuickSightといったAWSサービスによってクエ

                                AWS Cost and Usage ReportsをSnowflakeからクエリする
                              • なれる!データエンジニア - Classi開発者ブログ

                                はじめに こんにちは。データプラットフォームチームのマイン(id:manhnguyen1998)です。 2024年1月からデータエンジニア留学(第1期)という制度を利用して、データプラットフォームチームに配属されています。第1期生として、このデータエンジニア留学制度について、自分の経験をもとに紹介したいと思います。 データエンジニア制度とは データエンジニア留学制度は基本的にSRE留学と同じですが、留学先はデータプラットフォームチームです。SRE留学に関する記事はいくつかありますのでご覧ください。 tech.classi.jp tech.classi.jp tech.classi.jp なぜ留学したのか? もともとバックエンドエンジニアとしてRailsのアプリケーション開発を行っていましたが、ある時社内のBigQueryでデータを見る機会がありました。どうやってRDSからBigQueryま

                                  なれる!データエンジニア - Classi開発者ブログ
                                • OpenTelemetry を学ぼう! Mackerel チームのアウトプットのご紹介 - Mackerel ブログ #mackerelio

                                  こんにちは!Mackerel CRE の id:KGA です。 Mackerel 開発チームでは OpenTelemetry メトリック対応の正式化に向けて開発を進めていますが、開発中に得た技術的な知見を積極的に発信しています。その中には Mackerel をお使いいただいているユーザーのみなさまにも参考にしていただけるものが多くあります。本記事ではそんな Mackerel チームのアウトプットの中から OpenTelemetry に関するものをご紹介します! Mackerel の OpenTelemetry に関する取り組み(ラベル付きメトリック機能)については以下の記事もご参照ください。 OpenTelemetry 対応(パブリックベータ)提供開始 - Mackerel ブログ #mackerelio なぜ Mackerel は OpenTelemetry のラベル付きメトリックをサポ

                                    OpenTelemetry を学ぼう! Mackerel チームのアウトプットのご紹介 - Mackerel ブログ #mackerelio
                                  • 悪戦苦闘! PCI DSS準拠の社内システムをCognitoで認証する - inSmartBank

                                    はじめに こんにちは!SREを担当してます上平と申します。 このエントリーではスマートバンク内部の業務で使われるシステムを構築した際の話を苦労した内容や学びを含めてご紹介したいと思います! 我々のようなカード発行業者はカード番号からユーザーを特定する業務があります。 この業務を効率化し、よりセキュアに担当者が業務を実施できるように管理画面を構築する必要がありました。また、このシステムはPCI DSSに準拠するように構築する必要があります。 今回は構築する際の技術選定や問題点についてご紹介し、これから同じようなシステムを構築される方の参考になれば幸いです。 PCI DSSとは PCI DSSとはクレジットカード業界のセキュリティ基準のことで詳しくは以下の記事も御覧ください! blog.smartbank.co.jp 技術選定の観点 まず技術選定を行う上で、我々がやりたかった観点と、PCIDS

                                      悪戦苦闘! PCI DSS準拠の社内システムをCognitoで認証する - inSmartBank
                                    • 116. エムスリーのエンジニアリング組織運営 w/ vaaaaanquish | fukabori.fm

                                      MP3ファイルをダウンロード 内容紹介 vaaaaanquishさんをゲストに、エムスリーのエンジニアリング組織運営について語っていただいたエピソードです。 出演者 話したネタ 聴くエンジニアtype マネジメントに目覚めたきっかけ VPoEとしてのばんくしさんの仕事 ばんくしさんの目標設定 エムスリーのROI文化 目標設定はツリー構造にしている? エンジニア組織のチーム構成とは? エンジニアリングマネジメントの役割は、チームの外にある? 共通のインフラチームやSREチームはある? 技術選定の方法 オペレーションは誰が担っている? 技術的負債の対応方法は? 採用時にギークさをどう見極めているか? チーム内でどのように合意するか? プロダクトマネージャーと開発エンジニアはどのようにコミュニケーションしている? 開発エンジニアの顧客接点は? ギークかつプロダクト志向な人を求めている? 目標設定

                                        116. エムスリーのエンジニアリング組織運営 w/ vaaaaanquish | fukabori.fm
                                      • ZOZOTOWNフロントエンドチームで内定者アルバイトをした話 - ZOZO TECH BLOG

                                        はじめに はじめまして。2024年に新卒として株式会社ZOZOに入社しました。佐藤仁と申します。 この記事は4か月間にわたる内定者アルバイトの体験記です。アルバイトの概要、チームの文化、実際に行ったタスク、反省点、フィードバックをご紹介します。 目次 はじめに 目次 内定者アルバイトについて 内定者アルバイトでの働き方 実際にアルバイトをした部署の概要 ZOZOTOWN開発1部フロントエンドブロックの取り組み 週一回の輪読会 Findy Team+による開発運用の改善 実際に行ったタスク 似合うアノテーション 背景 開発体制 実装箇所 得られた知見 フィードバックと反省点 最後に 内定者アルバイトについて 内定者アルバイトとは内定承諾から入社までの期間にアルバイトの雇用契約を結び、内定先で就業できるものです。 選考時に志望していた職種以外の求人に応募できます。同期を見ているとフロントエンド

                                          ZOZOTOWNフロントエンドチームで内定者アルバイトをした話 - ZOZO TECH BLOG
                                        • AWSSummitへ初めて行く人に向けた最大限楽しむためのTips - Qiita

                                          はじめに AWSSummit2024が6/20-21に幕張メッセで開幕されました! 私は初めての参戦でしたが、面白い企画やブースがたくさんありとても楽しかったです。 せっかくなので、「行って見たいけど、一歩が踏み出せない」「いつもオンライン参加で、現地って何がいいの?」って方向けに会場の周り方や行くときに覚えておくと良いことをここ残していきます。 事前準備 これだけは、事前に準備しておくと当日スムーズに周れるよっていうのを挙げておきます! テーマを決める 今回のAWSSummitへ行くテーマを来ましょう! 周り切れないほどたくさんのブースがあります。 AWS Summit 2024の私のテーマは優先度順に以下のような感じ AWS Summitを歩き回って雰囲気を感じたい AWSのセキュリティサービスの理解を深めたい サードパーティの監視サービスの理解を深めたい 出展しているAIの体験してみ

                                            AWSSummitへ初めて行く人に向けた最大限楽しむためのTips - Qiita
                                          • 【合格記】Google Cloud Professional Cloud DevOps Engineer

                                            初めに こんにちは。hikaruです。 普段、Google CloudでSRE的な業務内容を行なっています。 今回、Google Cloud上でのSREの原理原則や基本用語、立ち回りの理解を確認するために、Google Cloud Professional Cloud DevOps Engineerの認定試験を受験しまして、無事合格することができました。 また、今までは以下のGoogle Cloud認定資格を取得済みです。 Associate Cloud Engineer Professional Cloud Architect Professional Cloud Network Engineer Professional Cloud Developer Professional Cloud DevOps Engineerとは Professional Cloud DevOps Engi

                                              【合格記】Google Cloud Professional Cloud DevOps Engineer
                                            • 【NTTコミュニケーションズ様との共同実証報告】AI時代のネットワーク運用高度化に向けた取り組み | IBM ソリューション ブログ

                                              主要カテゴリー IBM Cloud Blog IBM Data and AI IBM Consulting IBM Partner Ecosystem IBM Sustainability Software Client Engineering IBM テクニカル・サポート 社員が語る「キャリアとIBM」 IBM Cloud Blog IBM Cloud News IBM クラウド・ビジョン IBM Cloud アップデート情報 IBM Cloud チュートリアル IBM Data and AI IBM Watson Blog アナリティクス Data Science and AI SPSS Modeler ヒモトク Db2 オートメーション IBM Consulting デジタル変革(DX) アプリの開発とモダナイゼーション 製品/サービス ソフトウェア ハードウェア サービス 無料評価

                                                【NTTコミュニケーションズ様との共同実証報告】AI時代のネットワーク運用高度化に向けた取り組み | IBM ソリューション ブログ
                                              • Terraformのtfstateについて考える - 目の前に僕らの道がある

                                                この記事は3-shake Advent Calendar 2023の23日目の記事となります。 3-shakeのカレンダー | Advent Calendar 2023 - Qiita こちらはSRE Tech Talk #6で話した内容に補足したものです。 3-shake SRE Tech Talk #6 - connpass 資料はこちらとなります。 tfstateとは tfstateの課題 tfstateの管理場所をどうするか問題 local S3/Google Cloud Storage GitLab Terraform Cloud tfstateを管理するリソースをどう管理する問題 aws/gcloud コマンド terraform + local state 管理 CloudFormation / Google Deployment Manager tfstateをどう分割する

                                                  Terraformのtfstateについて考える - 目の前に僕らの道がある
                                                • 主席エンジニアと「Fensi Platform」テックリードが語る、プラットフォームエンジニアリングがもたらす良質な開発体験 | CyberAgent Way サイバーエージェント公式オウンドメディア

                                                  船ヶ山 慶 (株式会社CAM 専務執行役員) 2010年入社。主席エンジニア。様々なメディア事業やゲーム事業のバックエンド / インフラを担当した後、取締役として動画配信サービスを展開する子会社の立ち上げに参画。2018年に子会社CAMのCTO就任。ならびに2022年より子会社タップルのCTOも担う。 石川 諒 (株式会社CAM Creative Division Platform Engineer Group) 2019年に株式会社CAMにバックエンドエンジニアとして新卒入社。 Node.js, TypeScript, Go を書きつつ、社内の多数のサービスを支えるプラットフォームの開発・運用に従事。現在は、プラットフォーム上で開発するエンジニアの開発者体験や生産性を向上させるため、SREと協力しながら Platform Engineering に取り組んでいます。 ── エンジニアとし

                                                    主席エンジニアと「Fensi Platform」テックリードが語る、プラットフォームエンジニアリングがもたらす良質な開発体験 | CyberAgent Way サイバーエージェント公式オウンドメディア
                                                  • 大規模サービスの負荷試験を改善していった話

                                                    こんにちは!株式会社COMPASSのシステム開発部、SREチームのごーすと(@5st7)です!普段は、k8s周りの運用であったり、アプリケーションのパフォーマンスの監視、改善、インフラ周りの自動化などを積極的に進めています。三度の飯よりも好きなものがプリンで、美味しいプリンの店とかが流れてきたら1営業日以内に馳せ参じます。プリン好きな人はお店で会いましょう。 今日は負荷試験の取り組みについてご紹介できればと思います。COMPASSが提供するキュビナは現在100万人を超えるユーザーに利用していただいていますが、その分トラフィックも大きく、安定してサービスを提供できるようにするために、様々な工夫をしています。その中でも利用の集中する時間帯の負荷に耐えられるかの検証は非常に重要な取り組みの一つです。今回は、COMPASSが今まで負荷試験にどのように取り組んできたのか、その歴史と改善を行っていった

                                                      大規模サービスの負荷試験を改善していった話
                                                    • Google Chromeで素早くAWSマネージメントコンソールの特定のサービスページを開く方法 - エス・エム・エス エンジニア テックブログ

                                                      こんにちは! 5月に株式会社エス・エム・エスへ入社しました、SREの西田和史です。 今日はAmazon Web Services(以下AWS。各サービス名も一般的な略称で表記します)周りのTipsを共有します。 解決したい課題 AWSマネージメントコンソールで特定のサービスのページを開こうとすると、たくさんのサービスがあることもあり結構手間がかかります。 よく使うサービスはホーム画面にリストで表示されていますが、リストの順番は毎回変わりますし、 検索機能も使いにくく、「ECR」など妥当なキーワードでも対応するサービスが出てこないこともあります。 解決策 Google Chromeのサイト内検索機能を使います。 手順 chrome://settings/searchEngines を開きます(もしくは次の画像のメニューのクリックでもOK) サイト内検索の項目で「追加」のボタンを押す 次のよう

                                                        Google Chromeで素早くAWSマネージメントコンソールの特定のサービスページを開く方法 - エス・エム・エス エンジニア テックブログ
                                                      • SRE勉強会 ~各社の取り組みや課題から学ぶ会~|IT勉強会・イベントならTECH PLAY[テックプレイ]

                                                        イベント内容 概要 SRE勉強会 ~各社の取り組みや課題から学ぶ会~ ITテクノロジーに関する様々な職種やテーマで「他社・他の人ってどうしてるの?」を学ぶ、 TECH Streetコミュニティ恒例の事例・知見共有勉強会。 今回は各社のSREに携わるエンジニアが集 まり、各社のSREに関する事例や知見を発表します! 今回も質問コーナーをたっぷり設けますので、いろんな「知りたい!」に応えられる会を目指します! 主催/IT・テクノロジー人材のためのコミュニティTECH Street https://www.tech-street.jp/ ※本イベントは後日イベントレポートを公開いたします。 ※ イベントはZoomのミーティング機能を利用して開催予定です。 SNS・イベントレポート等にお名前やお顔が映り込む可能性がございます。 映り込みがNGの方は、ビデオオフやZoom表示名変更の上でご参加くださ

                                                          SRE勉強会 ~各社の取り組みや課題から学ぶ会~|IT勉強会・イベントならTECH PLAY[テックプレイ]
                                                        • 入門 ポストモーテム

                                                          前回に引き続き今回も寄稿させていただきましたGMOペパボでSREをやっている渡部龍一です!今回は自分たちのチームでも取り組んでいるポストモーテムについての入門記事を書きました。 イントロダクション ポストモーテムとは何か ポストモーテムとは、システムやサービスにおける重大なインシデントや障害が発生した後に、その原因を詳細に分析し、再発防止策を講じるためのプロセスです。このプロセスは、インシデント発生直後に行われることが多く、関係者全員が集まり、事実を基に議論を行います。私が所属しているチームでもインシデント後のポストモーテムは重要と考えており実際に取り組んでいます。 なぜポストモーテムが重要なのか ポストモーテムの目的は、単に問題を解決するだけでなく、同じ過ちを繰り返さないようにすることです。これにより、システムの信頼性を向上させ、サービスの品質を維持することができます。さらに、ポストモー

                                                            入門 ポストモーテム
                                                          • Webを変革するCatchpointの強化されたWebサイト体験ソリューション | SpeedData

                                                            CatchpointとWebPageTestの統合 2024年7月5日 翻訳: 逆井 晶子 この記事は米Catchpoint Systems社のブログ記事「Transforming web performance with Catchpoint’s enhanced Website Experience Solution」の翻訳です。 Spelldataは、Catchpointの日本代理店です。 この記事は、Catchpoint Systemsの許可を得て、翻訳しています。 完璧な顧客体験の提供は、今日のデジタル環境においてもはや贅沢ではなく必要不可欠です。 ユーザージャーニーの中断は、売上と収益の損失、およびブランドの評判の損失につながる可能性があります。 Catchpointでは、世界中のユーザーに卓越したデジタル体験を提供するお手伝いをしています。 そのため、Webテストのゴールドス

                                                              Webを変革するCatchpointの強化されたWebサイト体験ソリューション | SpeedData
                                                            • kubernetesのマニフェスト管理 比較検討(Helm/Kustomize)

                                                              はじめに 実務において、kubernetesのマニフェスト作成(管理)の方法としてHelm or Kustomizeという選択肢がとられている。 ここでは、クライアント組織への導入したときの話をしたいと思う。 クライアント組織の要求事項と特性を整理した上で、どちら(または同時使用)が適切か判断するための調査を行う Helm : https://helm.sh/ Kustomize : https://kustomize.io/ TL;DR 個人的にはHelmの使用を推奨したい アプリケーション / インフラ / SREと多くのレイヤーの人が関わる組織統制を考慮したときに、Helmを使用した方がバランスの取れた運用に近づくのではないか 調査 背景 大規模な組織であるクライアント組織では、開発に際して日々、多くのステークホルダーが関わっている その中で、開発組織や技術レベルに対して統制をとるこ

                                                                kubernetesのマニフェスト管理 比較検討(Helm/Kustomize)
                                                              • IBM Think2024に参加してきました

                                                                5月に開催されたIBM Think 2024に参加してきましたのでレポートしたいと思います。 IBM Thinkについて IBM ThinkはIBM社の年次イベントで世界中から4,000人以上の人が集まるイベントです。 今年はボストンで開催され、日本からは約200人が参加されていました。 同タイミングで開催されていたMicrosoft Build 2024も4000人以上の参加者だったようですので、同規模のIT関連イベントがアメリカ国内で同時に行われていたということになります。 来年以降も行く人がいればということで、レポート残しておきたいと思います。 場所 アメリカ マサチューセッツ州のボストンのBCEC(Boston Convention and Exhibition Center)で開催されました。 期間 2024年5月21日(火)-5月23日(木)の3日間での開催でした。 ホテル イ

                                                                  IBM Think2024に参加してきました
                                                                • 変化と安定を両立、データ基盤運用に求められるデータベース信頼性エンジニアリング

                                                                  データ基盤の運用について、DMBOK2(Data Management Body of Knowledge)では「データストレージとオペレーション」の領域として定義しています。データ自体の運用はここには含まれていません。データマネジメント組織では、この連載の第3回 ビジネス目標を共有、「失敗しない」データマネジメント組織の設計とは で説明したデータベースエンジニア(データベース管理者、DBA)が担当する業務です。 クラウド、特にDX(デジタルトランスフォーメーション)に関わるシステムのデータ基盤運用は、オンプレミスの基幹システムを中心とした運用と大きく異なります。従来は安定性を重視し、できるだけデータ基盤を変更しないように保守的な運用をするのが主流でした。 DXはこれまでより高い頻度でシステムを変更し、イノベーションを起こすことを目標にします。積極的に改善・リリースしたい開発チームに対して

                                                                    変化と安定を両立、データ基盤運用に求められるデータベース信頼性エンジニアリング
                                                                  • GKE クラスタでは64ノードしか作れない?!Cloud NAT でハマった話 - GO Tech Blog

                                                                    GKE クラスタでは64ノードしか作れない?!Cloud NAT でハマった話 こんにちは、SREグループのカンタンです! GO株式会社では AWS EKS と GCP GKE の Kubernetes クラスタを活用していますが、 数週間前に本番 GKE クラスタのメンテナンス作業を実施した際にノードを65台以上に増やせなくて急遽対応が必要になりました。 まさか GKE クラスタでは64ノードしか作れないことはないですよね? 本記事では発生した問題の原因と対策方法を紹介します。 発生した問題 GKE クラスタのノードプールの再設計とマシンタイプの調整のためにメンテナンス作業を実施しました。 その作業の中でクラスタ全体のノード数を60台ぐらいから80台までに増やす必要がありましたが、ノードを増やしたら以下の現象が起きてしまいました。 新しく作成されたノードの DaemonSet Pod が

                                                                      GKE クラスタでは64ノードしか作れない?!Cloud NAT でハマった話 - GO Tech Blog
                                                                    • インフラ改善を専任エンジニア0人で実現する方法━「インフラ部」座談会|AppBrew

                                                                      AppBrewで運営する美容プラットフォーム「LIPS」は累計DL数900万、web,app含むMAU1000万を突破し、国内最大級の規模へと成長しています。 そんなLIPSの開発チームには現時点でインフラ専任エンジニアはまだ0人!インフラ開発・整備は複数人のエンジニアにより構成される「インフラ部」により支えられています。 専任なしでどうやって運営してきたのか、4名の「インフラ部」メンバーに話していただきました。 また、今回AppBrew1人目SREの募集も開始しています!最後に募集ページも掲載しているのでぜひ最後まで読んでくださいね。 この記事は、こんな人におすすめ ● インフラエンジニア、SREの方 ● インフラエンジニアがいないスタートアップ ▼座談会参加者 oreo(@reo11_ds):アルゴリズムエンジニア。現在はtoB SaaS事業開発を担当。 Pin(@spinute):取

                                                                        インフラ改善を専任エンジニア0人で実現する方法━「インフラ部」座談会|AppBrew
                                                                      • 文化による成功: 失敗を受け入れることがなぜより良いソフトウェア デリバリーを促すのか | Google Cloud 公式ブログ

                                                                        物事はうまくいかないものです。それが摂理です。物事が思いどおりに進まないとき、重要なのは次に何が起こるかです。 ※この投稿は米国時間 2023 年 10 月 28 日に、Google Cloud blog に投稿されたものの抄訳です。 Google と Google の DevOps Research and Assessment(DORA)組織による内部調査によると、信頼の文化、つまり質問やリスクテイク、間違いを許容する文化を奨励するチームの方がパフォーマンスが上向くことがわかっています。機会に対しどのように応じるかということは、組織文化の重要な要素です。また、ソフトウェア デリバリーとチーム全体の効率においては、組織が障害にどのように対応するかが同様に重要となります。 復元力を促進する一定の行動や働き方を採用することで、チームの有効性を高め、組織のパフォーマンスを向上させることができま

                                                                          文化による成功: 失敗を受け入れることがなぜより良いソフトウェア デリバリーを促すのか | Google Cloud 公式ブログ
                                                                        • Amazon Bedrock 生成AIアプリ開発入門 - Forkwell Library #58 (2024/07/16 19:30〜)

                                                                          📝 開催概要 「つぎの一歩が見つかる、気づきと学びの場」 Forkwell Library シリーズ 第58弾 これまで Forkwell のイベントで登壇されたエキスパートの方々は、先達が記した書籍から「気づき」を得て実践し、振り返り、再現性のある「学び」として身に付けていく中で、実績を築いてこられました。 しかし、日々限られた時間の中で知識や情報をアップデートし続けるのはそう簡単ではありません。 Forkwell Library では、著者・訳者・実践者らを登壇者として招き、そんな思いを抱えた開発者の皆さまが「学びのきっかけ」を得られる勉強会を目指します。 第58回目では『Amazon Bedrock 生成AIアプリ開発入門』を取り上げます。 AWSの生成AIサービスを体系的に解説した、いちばん詳しい入門書です。生成AIサービスAmazon Bedrockを使ったアプリ開発を丁寧に解

                                                                            Amazon Bedrock 生成AIアプリ開発入門 - Forkwell Library #58 (2024/07/16 19:30〜)
                                                                          • 【入社エントリ】中途で入社して1ヶ月が経ち、見えてきた会社のGoodな部分をまとめてみる

                                                                            はじめに こんにちは!6月にレバテック開発部に中途で入社した宮下です。 まだ入社をして1ヶ月も経っていませんが、新参者だからこそクリアに見える会社のGoodな部分をあげていきたいな〜と思います🌟 良いところも悪いところも、長く居ると慣れて当たり前になってしまうので、当たり前になる前にアウトプットします。 1️⃣ 人との繋がり 人との繋がりが強いな!って思ってます。 この要素がGoodになるかどうかは人によりますが、私にとってはGoodでした。 人との繋がりって何やねんって感じですけど、"コミュニケーションの量と範囲"と捉えてもらえたらいいと思います。 具体的には以下の3つが大きな要因になっていると思っています。 Good&New 雑相会 週3出社以上 Good&New こちらは、24時間以内にあった「良かったこと(Good)」や「新しい発見(New)」を共有する会のことです。レバテック開

                                                                              【入社エントリ】中途で入社して1ヶ月が経ち、見えてきた会社のGoodな部分をまとめてみる
                                                                            • Software Design 2024年6月号 連載「レガシーシステム攻略のプロセス」第2回 ZOZOTOWNリプレイスにおけるIaCやCI/CD関連の取り組み - ZOZO TECH BLOG

                                                                              はじめに 技術評論社様より発刊されているSoftware Designの2024年5月号より「レガシーシステム攻略のプロセス」と題した全8回の連載が始まりました。 本連載では、ZOZOTOWNリプレイスプロジェクトについて紹介します。2020年に再始動したZOZOTOWNリプレイスでは、「マイクロサービス化」が大きなカギとなりました。今回は、SRE部が行った、リプレイス方針の決定から導入ツールの選定、マイクロサービスのリリース方法の改善までを紹介していきます。 目次 はじめに 目次 ZOZOTOWNリプレイスにおけるSRE部の方針 IaCの導入 IaCとは プラットフォーム基盤におけるIaC CI/CDの導入 CI/CDとは GitHub Actions 変更のあるインフラリソースのみをCIの対象とする工夫 Canary Releaseの導入 Canary Releaseとは ZOZO A

                                                                                Software Design 2024年6月号 連載「レガシーシステム攻略のプロセス」第2回 ZOZOTOWNリプレイスにおけるIaCやCI/CD関連の取り組み - ZOZO TECH BLOG
                                                                              • それでも、SRE の銀の弾丸を求めて

                                                                                自己紹介 こんにちは。Datadog Japan で Sales Engineer をしている 木村健人(AoTo)です。 Sales Engineer という職種は、Datadog の導入を検討されているお客様にプリセールスの段階で専任のスペシャリストとして導入支援を行う役割を担うことが主な業務です。そうした中で、システムに Datadog / Observability の導入を検討されている様々なエンジニアの方々の悩みを伺ってきました。 本記事では、こうした悩みを元に「SRE(Site Reliability Engineering) の銀の弾丸」を求めていくというシナリオでの考察を行います。 銀の弾丸とは そもそも、「銀の弾丸」とはフィクションの世界で不死身や強靭な生命力を持つ狼男・魔女・魔物に対抗する一撃必殺の手段として説明され、転じて万能な解決手段としての比喩表現として用いられ

                                                                                  それでも、SRE の銀の弾丸を求めて
                                                                                • 巻頭言:一人SREsのドキュメンテーション実践

                                                                                  今回の巻頭言は、一人でSRE活動をやっている中で実践しているドキュメンテーションに関するTipsと、最後に来年開催致しますSRE Kaigiの話を少しいたします。 SREにおけるドキュメンテーション SRE活動を行う上で、ドキュメンテーションは非常に重要です。その重要性は「SREの探求」にも記載されているように、ドキュメントの有無や品質はサービスの信頼性にまで影響が及びます。 それほど重要なドキュメンテーションですが、一人でSRE活動を行っている場合、どのようにドキュメントを作成し、運用していけばいいのか?というのは非常に難しい問題です。 私自身も一人でSRE活動を行っている中で、ドキュメントの作成や運用について悩んでいました。そこで、実践しているいくつかのTipsを紹介します。 開発とドキュメントは必ずセットで進める SREsとして開発を行うことは多々あると思いますが、必ず何かを作成した

                                                                                    巻頭言:一人SREsのドキュメンテーション実践