本文「SRE」を検索 - はてなブックマーク

161 - 200 件 / 3772件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

SREの検索結果161 - 200 件 / 3772件

DMARCの対応って進んでますか？ - エムスリーテックブログ
- 207 users
- www.m3tech.blog
- テクノロジー
- 2023/12/26
こんにちは。エムスリーでSREやセキュリティに従事している山本です。以前に、「Gmailのメール認証規制強化への対応って終わってますか？」という記事を書かせていただいておりますが、そこでちょい出しだけしたDMARCについて書かせていただきたいと思います。 www.m3tech.blog Gmailへの対応を実施するだけならば、「とりあえずよくわかんないけど入れておけばOK」なのですが、そもそもDMARCは何のために存在していてどのように活用にするのかというところに触れていきたいと思います。 DMARCとは SPF/DKIM DMARC登場 DMARCで実施できるポリシー三種ポリシーの強化強化できるか DMARCレポート RUA/RUFの二種のレポート DMARCレポートの確認ツールどう判断するかメール転送今後まとめ We are hiring! DMARCとは DMARCの日
- メール
- DMARC
- DKIM
- セキュリティ
- あとで読む
- mail
- SPF
- gmail
- ドメイン
- security
いろんなやり方の読書会をやってみたら当日音読その場でまとめ方式が最高だった話 - Gunosy Tech Blog
- 206 users
- tech.gunosy.io
- テクノロジー
- 2023/12/03
こんにちは、SRE チームマネージャーの Yamaguchi（@yamaguchi_tk ）です。こちらの記事はGunosy Advent Calendar 2023の3日目の記事です。前回の記事は森田さんの LLM 論文の探し方でした。概要 SRE チームは、シニアエンジニアとジュニアエンジニアで構成されているチームで、チーム内の技術的な知識の偏りの解消や、知識のタコツボ化の解消を目的として読書会をしてきました。その過程でいろいろな読書会のパターンを行ってきましたので、その結果を共有します。概要読書会開始前の SRE チームの課題感読書会のやり方の整理と評価の観点やり方評価の観点当日音読・Slack に投下する方式実際のまとめ方式詳細評価メリットデメリット事前に読んで Miro*1 に付箋・当日議論する方式実際のまとめ方式詳細評価メリットデ
- 読書会
- あとで読む
- 読書
- チーム
- 本
- 仕事
- 書籍
- コミュニケーション
- work
- 読み物
なぜリモートでも完全にペアプロで開発するのか？ XPのプラクティスをどこまでも徹底するユーザベースの挑戦を恐れない開発文化 - はてなニュース
- 206 users
- hatenanews.com
- テクノロジー
- 2021/05/26
ステイホーム期間が続き、開発者がオフィスで顔を突き合わせることも少なくなっています。そんなリモートワークが既定となった状況下でも、ユーザベースのB2B SaaS事業では開発に関わる全てを徹底してペアプログラミングで行っています。その根幹には、XP（eXtreme Programming）のプロセスを推進することで開発効率を向上させる意図があり、それが多種多様なプログラミング言語やマイクロフロントエンドといった目新しい技術を恐れることなく積極的に採用する開発文化を生み、ひいてはシェアドリーダーシップによる自己組織化されたチームのあり方につながっています。わずか10人程度だったエンジニア組織を4年で10倍の規模に拡大し、さらに組織と事業の成長を目指すCTOの林尚之さん、スペシャリストとしてFellowの肩書を持つ板倉大輔さん、入社2年目のエンジニア片山景太さんの3人にお話をうかがいました。
- 開発
- あとで読む
- 組織
- エンジニア
- techfeed
- 考察
- development
- 技術
- programming
コロナ禍での転職活動(データエンジニア)についてのメモ - yasuhisa's blog
- 205 users
- www.yasuhisay.info
- テクノロジー
- 2021/03/21
Twitterでは先に言っていましたが、現職のはてなを3月末で退職します。3/19が最終出社日でした。はてなでの思い出はこちらに書きました。そのため、転職活動をしたわけですが、コロナ禍での転職活動は平常時と異なる部分も結構ありました。また、データエンジニアとしての転職は初めての経験でした。誰かの参考になるかもしれないので、私が考えたことや感じたことをメモ書きとして残しておきます。在宅勤務と就業可能な地域 Web上でのアウトプットデータエンジニアという職種の多様性転職にあたって重視したこと魅力に感じた点当然、不安もある在宅勤務と就業可能な地域カジュアル面談させてもらった企業さんは、ほぼ在宅勤務に移行済みだった隔週や月一で物理出社という会社も半々くらい? 緊急自体宣言が出ていない時期(夏〜秋)にカジュアル面談させてもらったので、今は状況が違うかもカジュアル面談、採用面談もz
- 転職
- あとで読む
- エンジニア
- データ
- 会社
- engineer
- career
アンチウイルスソフト Antivirus for Amazon S3 を本番環境に導入してみてわかったメリット・デメリット - ANDPAD Tech Blog
- 205 users
- tech.andpad.co.jp
- テクノロジー
- 2024/04/04
こんにちは。SREチームの吉澤です。アンドパッドでは最近、AWSのS3バケット上のファイルをスキャンするために、アンチウイルスソフト Antivirus for Amazon S3 を本番環境に導入しました。その結果、私たちの要件はほぼ全て満たされたうえに、従来比で大幅なコスト削減を実現できました。 Antivirus for Amazon S3について日本語で書かれた記事はまだ少ないですが、S3に対するウイルススキャンが求められるケースでは、導入を検討する価値があるソフトです。そこで、今回はこのAntivirus for Amazon S3の概要、私たちが本番環境に導入してみてわかったメリットやデメリット、そしてこのソフトが適した状況をご紹介します。背景 S3に対するウイルススキャンが必要な理由 Antivirus for Amazon S3の導入前に利用していたソフト Antiv
- aws
- あとで読む
- セキュリティ
- S3
- security
- antivirus
- techfeed
- Amazon Web Services
- Amazon
- 資料
社内技術ドキュメンテーションを科学する - スタディサプリ Product Team Blog
- 205 users
- blog.studysapuri.jp
- テクノロジー
- 2023/12/15
最終更新日: 2024年05月07日(火) 1. ご挨拶 2. 本記事執筆のモチベーション 3. ワークショップを通じて得たフィードバック 3-1. Pains -過去抱えた/現在進行形で抱えている辛み- 3-2. Approaches/Solutions -Pains を解消するために取った方策や導き出した解決策- 3-2-1. えいやで場所を決め打ちしてしまう(e.g., GitHub Wiki + Google docs しか使わない) 3-2-2. 個人的に、2023/12/05時点で〜みたいな書き方を心がけている 3-3. Tips -効果的な手法- 4. オーディエンスからの反響 4-1. 気づきや学び・NEXT ACTIONS 4-2. プレゼンター(@hayat01sh1da)へのフィードバック 4-3. Slack での反応 5. おわりに 1. ご挨拶初投稿となります
MySQLのロックに起因するブロックタイムアウト撃退記 - inSmartBank
- 204 users
- blog.smartbank.co.jp
- テクノロジー
- 2024/10/02
こんにちは。スマートバンクのサーバーサイドエンジニアをやっておりますid:moznionです。すっかり秋めいてきましたね。秋といえばMySQL*1、ということで今回は先日解消した「MySQLのロックに起因するブロックタイムアウト」のトラブルシューティングついて記していきたいと思います。事の発端ある時を境にSentryに ActiveRecord::LockWaitTimeout というエラーがしばしば報告されるようになっていました。 SentryにActiveRecord::LockWaitTimeoutが上がってきている様子 Mysql2::Error::TimeoutError: Lock wait timeout exceeded という文言から、MySQL上でロックを取っている他のクエリにブロックされ、そのブロックが長時間に渡ったため自クエリがタイムアウトしてabortしてし
SREチームでポストモーテムを1年半運用してみた - KAYAC Engineers' Blog
- 204 users
- techblog.kayac.com
- テクノロジー
- 2022/03/22
SREチームの藤原です。今回は、SREチームが主導してポストモーテムを書く取り組みを、社内で1年半ほど運用してみたという話です。ポストモーテムとは? 「ポストモーテム」(postmortem=事後検証)とは、システムにインシデントが発生したことによる影響、緩和や解決のために取られた行動、インシデントの原因、再発防止策などをまとめた文書です。カヤックのSREチームは、各メンバーがそれぞれのプロダクトに参加し、他のエンジニアとともに開発と運用を行う、いわゆる「Embedded SRE」という形態を取っています。そのため、SREチームのメンバーでも自分が関わっていないプロダクトで発生したインシデントについては詳しく把握できないことがありました。SRE以外で運用に携わっている、プロダクト専任のサーバーサイドエンジニアにはなおさら困難でした。また、インシデント発生時に実際に手を動かす人がどうし
猛烈に成長するSaaSのインフラを猛烈にカイゼンする技術 - ANDPAD Tech Blog
- 203 users
- tech.andpad.co.jp
- テクノロジー
- 2020/12/14
SREチーム鈴木心之介です。職歴の空白を経て参画しました。社名変更して co.jp ドメインを複数保有する技術の節は皆様ありがとうございました。たぶんそのうち書かれるだろう「Dockerコンテナ移行しました」記事の先史時代の記録として、また、事業の成長に併走してきたEC2でのアーキテクチャの御焚上として奏上するものです。問題意識アプリケーションはRuby on Railsで実装し、インフラはAWSにEC2, RDS, S3を中核に構成してます。運用状況はEC2に限らず大変きびしく、早くどうにかしないと事業の成長の足枷になりそうでした。入社前のカジュアル面談で伺っていた情報と、入社後の情報収集から、大枠の問題意識を以下4つに絞りました。デプロイメントセキュリティスケーラビリティディザスタリカバリどれも解決すべきで、優先順位にみなさま一家言あるかと思います。ただセキ
- インフラ
- あとで読む
- 監視
- aws
- CI
インフラマネージャー厳選！10年使える知識が身につくおすすめ書籍10選 - RAKUS Developers Blog | ラクスエンジニアブログ
- 203 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2024/02/01
ラクスでは多くのSaaSプロダクトを開発・運用しており、オンプレミスまたはクラウドを適切に選択してインフラ基盤を構築しています。そのインフラを担うのが、ラクスのインフラ開発部です。今回はインフラ開発部のマネージャーが厳選した、インフラエンジニアにおすすめの書籍10選をご紹介します。それぞれの書籍に推薦コメントを記載していますので、是非ご参考になさってください。選定基準は以下の通りで、今後インフラを深く理解し実力をつけていきたい方にも最適です。是非ご覧ください。「すぐに役に立つがすぐに廃れる知識ではなく、10年以上使える書籍」「分かりやすい本ではなく、難解ではあるがきちんと原理・原則を学べる書籍」目次目次 Operating Systemを理解しよう詳解 Linuxカーネル第3版 DNS & BIND 第5版トラブルシューティングを理解しよう詳解システム・パフォーマ
- インフラ
- あとで読む
- 書籍
- セキュリティ
- システム
- 本
- 設計
- 思考
- 知識
- 学習
後で楽できるTerraformの書き方（※ただし書くときは辛い） - SMARTCAMP Engineer Blog
- 201 users
- tech.smartcamp.co.jp
- テクノロジー
- 2023/04/16
はじめにざっくりしたシステム構成の紹介全体の構造設計のポイントコーディング規約上の階層を見に行かない変数名は全体でユニークにする変数のデフォルト値は設定しない main, outputs, variables 以外のファイルを原則置かないポリシードキュメントはJSONファイルのまま管理する変数で処理を変える仕組みを極力使わない値のハードコードをためらわないコードが冗長であることをためらわない残っている課題 AWSアカウント単位でしか用意しないものの扱い ECSのタスク定義の扱い最後にはじめにはじめまして。スマートキャンプのおにまるです。 2022年10月に入社し、SRE兼インフラエンジニアとして働いています。今回は、あるプロダクトの再スタートにあたって新しく作った、AWSのTerraformについてお話したいと思います。再スタートにあたってアプリケーション
SRE不在のチームに入って2ヶ月でやったこと - 負荷試験ツールからはじめるSREプラクティスの導入
- 201 users
- speakerdeck.com/fujiwara3
- テクノロジー
- 2023/04/27
TechFeed Experts Night#17 〜事例で学ぶSRE 〜ツール、プラクティスから組織づくりまで https://techfeed.io/events/techfeed-experts-night-17
- SRE
- あとで読む
- チーム
- performance
- ツール
- 運用
- Testing
- 組織
次世代データベース TiDB の検証とその評価 [DeNA インフラ SRE] | BLOG - DeNA Engineering
- 201 users
- engineering.dena.com
- テクノロジー
- 2022/01/20
※こちらは先日実施された DeNA インフラエンジニア / SRE MEETUP で話した内容を Blog 記事化したものです！こんにちは！IT基盤部の熊谷です。IT基盤部にて大規模ゲームのインフラを見ている新卒２年目のインフラエンジニアです。この記事では “DeNA でのデータベース運用とそのツラミ” と、“TiDB導入への検証・検討” をご紹介させていただきます。データベースの最適解 DeNA のデータベース構成は最適解を求めて改良を積み重ねてきました。最初期の構成、(便宜上、第１世代と呼びます) では VM Instance 上に MySQL を構築し管理する MySQL on EC2 構成。続く第２世代では、マネージドサービスを駆使した Aurora MySQL 構成。この２世代の中で生じた “ツラミ” を解消する次の世代、言わば第３世代に該当する新しいデータベース構成を現
- データベース
- database
- mysql
- db
- あとで読む
- DeNA
- 運用
- NewsQL
- インフラ
- aurora
事業継続のためにPHPを使ったサービスを継続的に進化させていくこと - BASEプロダクトチームブログ
- 201 users
- devblog.thebase.in
- テクノロジー
- 2020/09/10
BASE株式会社取締役 EVP of Development / PAY株式会社取締役 / BASE BANK株式会社マネージャのえふしんです。新型コロナによる非常事態宣言下で起きたことについては、大変勉強をさせていただきました。非常事態宣言下の巣ごもり消費、リアル店舗等でご活躍されている事業者様のEC利用が急増する中で、BASEにおいても例外ではなく、サービスに訪れるトラフィック急増、4月から5月の頭にかけては、サービスの安定性にも影響が出てしまうという状況が発生していました。その中で起きていた一つの事象を解決した件が以下のCTOによる記事です。 devblog.thebase.in この記事はCTOやSREチームやWebアプリケーションのエンジニアの活躍で、負荷急増の問題解決をした一つの事例となります。この対策を通じて、改めて認識したことがあります。それは、 BASEに訪れる
- php
- あとで読む
- 開発
- アーキテクチャ
- 技術
- tech
- development
Project Googrename: Google Workspace で 14 年運用されたドメインエイリアスをプライマリドメインに変更 & 全ユーザーを安全にリネームする - クックパッド開発者ブログ
- 200 users
- techlife.cookpad.com
- テクノロジー
- 2023/06/28
コーポレートエンジニアリング部の id:sora_h です *1。今回は 3 ヵ月ほど前に実施した、Google Workspace テナントのプライマリドメイン変更について、記録を兼ねて説明します。クックパッドは 2009 年頃 *2 より Google Workspace *3 を利用しています。当社の対外的なメールアドレスは cookpad.com ですが、Google ではプライマリドメインとして cookpad.jp が設定されています。各ユーザーには cookpad.com のアドレスを別名 (エイリアス) として登録されていて、メールアドレスとしては cookpad.com を利用、ただ Google へログインする時だけ cookpad.jp を利用する運用になっていました。想像が出来ると思いますが、これが様々な面で不便・混乱を発生させていました。どうしてこうなった… *
- cookpad
- google
- あとで読む
- google workspace
- ドメイン
- 運用
- 開発
- migration
- operation
- DNS
プライベートの時間は極力削らない。Kubernetesエキスパート青山真也氏のコスパ最高な情報収集術
- 200 users
- levtech.jp
- テクノロジー
- 2024/03/05
プライベートの時間は極力削らない。Kubernetesエキスパート青山真也氏のコスパ最高な情報収集術 2024年3月5日株式会社サイバーエージェント　インフラエンジニア青山真也 (Masaya Aoyama) 2016年、新卒でサイバーエージェントに入社。OpenStackを使ったプライベートクラウドやGKE互換なコンテナプラットフォームをゼロから構築し、国内カンファレンスでのKeynoteに登壇。著書に『Kubernetes完全ガイド』『Kubernetesの知識地図』『みんなのDocker/Kubernetes』。現在はKubernetesやOpenStackなどOSSへのコントリビュート活動をはじめ、CloudNative Days Tokyo Co-chair、CNCF Japan ChapterのOrganizer、Kubernetes Meetup TokyoのOrgani
- Kubernetes
- あとで読む
- 情報収集
- oss
- lifehack
- コンテナ技術
- study
- techfeed
- work
開発チームの責務を「エンジニアリング観点でのサービス継続リスクをコントロールしながら、開発速度を最大化する」としてみた話 - $shibayu36->blog;
- 199 users
- blog.shibayu36.org
- テクノロジー
- 2020/10/01
最近開発チームの改善を行う時に、どういう目的で開発チーム改善を行うのかや、開発チームの責務は何なのかについて悩んでいた。色々本を参考にしながら、自分の中でしっくり来た責務があったので、ブログにまとめておく。まず自分の中で、開発チームの責務は次のものであると言語化した。エンジニアリング観点でのサービス継続リスクをコントロールしながら、開発速度を最大化するなぜこの責務としたかまず現代のソフトウェア開発においては、非常に不確実な状況で、顧客にとって価値があるものが何かを探索しながら、高速に価値を創出・提供しなければならない。これを満たすためには、「正しいものをつくる」ということと、「正しくつくる」ということの両輪を回す必要がある。この時、プロダクトオーナー側と開発チーム側で分業するとすれば、やはり開発チームは「正しくつくる」ことに焦点を当てて責務を持つと良いと考えた。つまり開発速度(価
入社したらAWSコンソールにCloudWatchアラームが1000個以上あったので整理してる話 - Uzabase for Engineers
- 199 users
- tech.uzabase.com
- テクノロジー
- 2023/02/09
こんにちはNewsPicks SREチームの飯野です。今年の1月入社の新入社員です。そろそろお仕事に慣れてきました。今回は研修と研修の合間に地道に行っていたCloudWatchアラームの整理について話していきたいと思います。ちょっと長くなりますがお付き合いください。よくわからないしアラームを整理しようまずはスプレッドシートで一覧してみよう整理の方針を決めようさまざまな問題をかかえたアラームたち Case#1 AlarmActionが未設定のアラーム（5個） Case#2 ActionのSNSトピックが存在しないアラーム（16個） Actionを差し替えるのはちょっと手間 Case#3 ActionのSNSトピックの通知先が退職した社員のメールアドレス（97個） Case#4 監視先のDynamoDBのテーブルがすでに存在しないアラーム（97個中の85個） Case#5 監視先のE
- aws
- 監視
- あとで読む
- Amazon Web Services
- cloudwatch
- techfeed
- Amazon
- monitoring
Mercari Microservices PlatformにおけるKubernetes Cluster移行 | メルカリエンジニアリング
- 198 users
- engineering.mercari.com
- テクノロジー
- 2020/06/02
Microservices Platform Teamの@deeeeeeetと@dragon3です． Microservices Platform TeamではGoogle Kubernetes Engine（GKE）をメインのコンポーネントとして利用し，その上にメルカリとメルペイのMicroservicesを動かすための基盤を構築しています．メルカリのMicroservices化のプロジェクト自体は2年ほど前から始めており，GKEも当時に構築したものを今日まで運用し続けてきました．この2年間でGKEからは多くの機能がリリースされました．その中のほとんどはそのまま有効にすることができますが，中にはClusterを作り直す必要があるものもあります．例えばRoutes-based ClusterをVPC-native Clusterに，Zonal ClusterをRegional Clust
- kubernetes
- microservices
- GKE
- あとで読む
- GCP
- k8s
- mercari
- migration
日本経済新聞社を退職しました
- 198 users
- blog.ojisan.io
- テクノロジー
- 2024/08/02
業務委託期間を含めて４年在籍した日本経済新聞社を退職しました。日経に入るまで自分が日経に入った理由は３つあり、そろそろ健康保険が切れそうだったから Web標準への理解が求められる仕事をしたかったから情報を編纂すること、発信すること自体に興味があり、興味と事業ドメインがマッチするからです。なんと自己中な・・・前の会社を辞めてフリーランス（と名乗ってはいたがどちらかというと無職の方が実態には近かった）になったときの話も書いておくと、元々は営業から入社した職場で活躍できず逃げるようにエンジニアになったものの、その道で進んでいこうにも未経験で基礎的な能力が無かったので勉強期間を作りたくなって辞めました。当時社会人を経験して思ったのは、社会では期待される人に成長できる仕事が任されていくので、ブートストラップに失敗した自分はこれから常に不利な戦いを強いられ続けそうだということです。なので勉
- エンジニア
- 仕事
- あとで読む
- 勉強
- 技術
- 開発
社内サービスを一括・即座・セキュアにリモートワーク開放した話 - エムスリーテックブログ
- 197 users
- www.m3tech.blog
- テクノロジー
- 2020/09/11
はじめまして。エムスリーエンジニアリンググループSREチームの山本です。先日来のリモートワーク促進の中、弊社でも多くの社員がオフィス外から接続するようになりました。もちろん、VPNを利用すれば社内のサービスも利用できますが、VPNの使用量が一気に増えるとそちらの制限にかかります。今回「VPNを可能な限り利用せず、なおかつセキュアに社内のサービスを利用してもらう」という課題に取り組みましたので、ここでその紹介をさせてください。前提方針クライアント証明書の問題点一括でのSSL化・証明書検証ドメイン変換実際の設定 Squidの設定(抜粋) unboundの設定 nginxの設定(クライアント証明書検証) nginxの設定(HTTPサーバに対するproxy) nginxの設定(個別対応) ブラウザのProxy設定その後発生した問題ポート問題 Hostヘッダ問題戻りヘッダ問
マイクロサービスでチームを分離したくないマン - まっちゅーのチラ裏
- 197 users
- ma2k8.hateblo.jp
- テクノロジー
- 2020/10/21
コンウェイの法則とかで、マイクロサービス=組織という話になることが多いなと感じる。正解の場合もあるし、不正解の場合もあると思っていて、個人的には小さいチームでもマイクロサービスをやるメリットは技術的にも組織的にもあると思う。そのメリットを無視してすぐ組織の話に持っていきたくないので、基本分離したくないマンとしての主張を書いておく技術観点でのメリットいまさら語るまでもないけど、ドメイン境界の分離デプロイ独立性リソースの最適配分障害の局所化(サーキットブレーカー等) このうち、ドメイン境界の分離だけはモジュラモノリスで対応可能だが、あとの3つにはマイクロサービスが必須。(もっとあるかも) この3つが必要なのにモノリス or モジュラモノリスで進める判断をするということはシステムの表現力を落とすことに直結する。もちろん、複雑度は増すし難易度も増す。熟練のサーバーサイドエンジ
大量にあるKubernetesをどのように運用するか　ヤフーの運用自動化の仕組み
- 197 users
- logmi.jp
- テクノロジー
- 2021/01/14
KubeFest Tokyo 2020は、Kubernetes を利用している人、これから導入したい人が新しいことを学んだり、ネットワーキングすることを狙いとして開催するワンデイのオンラインイベントです。大規模なKubernetes環境では、たくさんのクラスタが存在します。これらを監視する仕組みについて、ヤフーの勝田氏と相良氏がお話しします。前半はヤフーのKubernetesの紹介から。全2回。監視の基礎から知る、ヤフーの大量クラスタ監視システムの仕組み相良幸範氏（以下、相良）：「監視の基礎から知る、ヤフーの大量クラスタ監視システムの仕組み」という題で、ヤフーの勝田と相良が発表いたします。このセッションでは、ヤフーのKubernetesを紹介し、Kubernetesクラスタの監視・運用について基礎を振り返ります。その後、ヤフーにおいて大量のクラスタをどう効率的に運用して安定稼働を実現
- kubernetes
- あとで読む
- 運用
- k8s
- 監視
- サービス
- チーム
Go Secure Coding Practice の日本語翻訳を公開します - Techtouch Developers Blog
- 195 users
- tech.techtouch.jp
- テクノロジー
- 2022/08/26
はじめに Go Secure Coding Practice とはコンテンツ一覧良かったところ注意すべきところ最後にはじめにこんにちは。SRE の izzii です。テックタッチのエンジニア規模もそれなりに拡大し、若手の採用も進んできたため、セキュアコーディングを徹底していきたいという思いがあり、まずは意識改革ということで勉強会を実施しました。セキュアコーディングを目的とした場合には教育だけでなく Static application security testing (SAST) の導入といった方法もあるのですが、まずは自分を含めた開発メンバーにノウハウをインストールすることにしました。セキュアコーディングへの意識が高まれば、いづれ SAST の導入の際に抵抗感も少ないだろうと考えています。いきなり SAST を導入しても、誤検知が煩くて浸透しないリスクもありうると考えてい
- go
- golang
- あとで読む
- security
- セキュリティ
- 開発
- programming
- 勉強
はてなで最近実施しているSRE研修の紹介 - Hatena Developer Blog
- 194 users
- developer.hatenastaff.com
- テクノロジー
- 2024/07/31
システムプラットフォームチームで SRE をしている id:masayoshi です。この記事は、はてなの SRE が毎月交代で書いている SRE 連載の7月号です。先月は id:chaya2z さんの AWS ECS で実行するバッチ処理を Cluster Auto Scaling を使ってコスト最適化するでした。今月は、社内で最近始めたSREへの研修についてお伝えします。 SREの研修 SREの研修は新卒入社のSREや、中途採用でインフラエンジニアやアプリケーションエンジニアからSREにジョブチェンジした方を対象に実施しています。 SREの研修は主に以下の2つに分かれます。 SREの原理原則やSLI/SLOに関する研修インフラ構築、運用、CI/CD環境の構築に関する研修基本的にはどちらも受けてもらうことになりますが、受講者の経験によってはどちらかだけになることもあります。ま
- SRE
- あとで読む
- 研修
- 運用
- はてな
- システム
- サーバ管理
- チーム
- hatena
- 開発
Engineering Manager になってから身に沁みた12のアイデアと言葉 - これはただの日記
- 193 users
- kths.hatenablog.com
- 学び
- 2019/12/21
本記事は、 Engineering Manager Advent Calendar 2019 の21日目の投稿です。あなたはだれスタディストという会社で、2018/9から SRE チームの Engineering Manager を担当しています。2019/9より開発組織全体の副部長を兼任し、活動をしています。この記事を書く背景と目的そこそこ昔から、チームや組織に関する書籍が好きで読み漁っていたのですが、 Engineering Manager になってから改めてそれらの書籍を読み返すと、これまでとは違った感じ方をできるようになりました。また、買った本の読み方も大きく変わったような感覚を持っています。そんな気持ちを皆さんとも共有したいと思い、私が最近よく読み返す書籍の中から、身に沁みた言葉・考え方をいくつか紹介したいと思います。何か1つでも参考になるアイデアがあれば幸いです。 En
- management
- あとで読む
- 組織
- 組織論
- チーム
- マネジメント
- 書籍
- book
Googleの徹底的なシステム障害への対応「SRE」の中身とは？
- 193 users
- gigazine.net
- テクノロジー
- 2020/03/17
インターネット上でサービスを提供する企業では、いかに自社のシステム障害と向き合うかが重要です。検索エンジンやクラウド、メール、広告など、さまざまなサービスを提供しているGoogleが、自社が提唱しているシステム管理の方法論「SRE」に基づき、システム障害にどう対応しているかを実際の事例をもとに紹介しています。 SRE keeps digging to prevent problems | Google Cloud Blog https://cloud.google.com/blog/products/management-tools/sre-keeps-digging-to-prevent-problems SREはサイト・リライアビリティ・エンジニアリングの略で、「サイト信頼性エンジニアリング」と訳されることもあります。Googleのような大規模な企業では、他の企業ではめったに起こらない
- SRE
- あとで読む
- google
- 障害
- 運用
- CPU
- cloud
エンジニアのためのSRE論文への招待 - SRE NEXT 2023 - ゆううきブログ
- 192 users
- blog.yuuk.io
- テクノロジー
- 2023/10/02
この記事では、2023年9月29日に開催されたSRE NEXT 2023 IN TOKYOでの講演の概要に加えて、講演では触れられなかった部分の補足と、発表を終えての後記、最後にSRE NEXT全体の感想を書きました。 SRE NEXT 2020の基調講演に招いていただいたところから始まり、昨年のSRE NEXT 2022の公募セッションでも発表し、今回で3回目の発表になりました。今回の講演は、SRE NEXTの「NEXT」と価値観の一つである「Diversity」を踏まえて、自身のエンジニアと研究者の両方の経験を活かして、SREを深く実践する上で、技術論文を探して読むアプローチを提示するものです。昨今の国内のSREコミュニティでは組織的実践に主な関心が移っている状況と対比させて、コンピュータサイエンスに基づく技術的挑戦の可能性を示唆する意欲的な講演を目指したつもりです。この講演での主要
- sre
- あとで読む
- エンジニア
- 論文
- paper
- techfeed
GitHubのトレンドで振り返る2021年のJavaScript/TypeScript
- 192 users
- blog.leko.jp
- テクノロジー
- 2021/12/25
今年も GitHub のトレンドで 2021 年の JavaScript/TypeScript を振り返ります。去年の記事はこちらです。 — GitHub のトレンドで振り返る 2020 年の JavaScript | WEB EGG 集計方法 GitHub トレンドは過去の履歴を公式に提供していないため、非公式に集計されたデータを利用しています。データソースはlarsbijl/trending_archiveを使用去年はxiaobaiha/github-trending-historyを利用したが今年のデータは無かったので変更日ごとにまとめた markdown になっており、remark で AST→ データ化しました集計期間は 2021/01/01 から 2021/12/15 まで対象言語はJavaScriptとTypeScriptのみ集計後のデータはこちらのスプレッドシー
- javascript
- github
- あとで読む
- TypeScript
- ツール
- node
- js
- dev
- 開発
AWSとGCP間でVPNを設定する方法 - Gunosy Tech Blog
- 192 users
- tech.gunosy.io
- テクノロジー
- 2019/11/29
はじめに AWSのネットワーク構成 GCPのネットワーク構成 AWS と GCP 間での通信 VPN設定手順 TGWを用いたルーティングの設定 (AWS) Shared VPC の設定 (GCP) Terraform まとめはじめにこんにちは。DR & MLOps Group というところで働いている阿部といいます。Data Reliability & Machine Learning Operations の略で、データ基盤やML基盤を作って運用するグループです。私はもともとは記事配信ロジックやデータ分析をやっているグループにいましたが、今年移ってきました。こちらが紹介記事です: DREの使命とは？「数が神より正しい」と言うための正確性を求められる技術力 – Gunosiru 弊社のシステムは基本的にはAWSで動いていますが、とあるプロジェクトでGCPを使うことになりました。そ
- aws
- GCP
- VPN
- あとで読む
- network
- cloud
- ネットワーク
- DevOps
- Google Cloud Platform
- gunosy
3大クラウド(AWS,Azure,GCP)をそれぞれプロダクションで実運用した感想(その3 AWS固有の優位性について) - Qiita
- 192 users
- qiita.com/lazy-kz
- テクノロジー
- 2023/09/11
3大クラウド(AWS,Azure,GCP)をそれぞれプロダクションで実運用した感想(その3 AWS固有の優位性について)AWSAzureGoogleCloud はじめに今年のはじめに書いた3大クラウドの比較シリーズに関して長いこと続編を書いてませんでした...。最近、知人/友人のみならず取引先からも「AWSやGCPに関して続編書かないんですか？」と言われることが増えてきたので、今回はAWSを本番運用していて感じたAWS固有の優位性について感想を述べていきます。 AWS 固有の優位性周知の事実ではありますが、AWSは長年クラウドベンダーとして世界トップシェアを維持し続けています。 AWSをクラウド基盤として利用しているサービスを一切利用せずに1日を過ごすことは不可能なんじゃないかというレベルで日本国内では利用されています。もはや電気/ガス/水道等の社会インフラに近い状態です。そして
- aws
- あとで読む
- gcp
- azure
- Google Cloud
- インフラ
- Microsoft Azure
- cloud
- クラウド
- techfeed
日本のSREの火付け役ともなったエンジニアが貫く信念 ─ すべてはログの向こうにいるエンドユーザのために - Findy Engineer Lab
- 191 users
- findy-code.io
- テクノロジー
- 2021/10/20
こんにちは、はじめまして。さくらインターネット株式会社の長野雅広（@kazeburo）です。Webの業界に入ったのは学生だった2000年頃で、キャリアは20年以上になります。おそらくこの業界でも長い方ではないでしょうか。20年の間にmixiやlivedoor、メルカリといった企業で働く機会を得て、どの職場でもサービスの裏側にあるインフラや、Webアプリケーションの運用を支える仕事、今ではSREと呼ばれるような業務に携わってきました。そして今年の1月から、さくらインターネットにてクラウドを中心にサービスの開発を行っています。つまり、インフラやクラウドを利用して一般のお客様向けにサービスを作るという仕事から、クラウドを作ることを仕事にする、という選択をしました。この記事では、どのような経験からSREとして働くようになったのか、また現職に至る選択をした経緯について語りたいと思います。加えて、
- SRE
- あとで読む
- isucon
- エンジニア
- kazeburo
- engineer
- 会社
- 開発
障害対応を属人化させない。「全員インシデントコマンダー」体制を根付かせた、山本五十六の格言【NewsPicks SRE 安藤裕紀】 | レバテックラボ（レバテックLAB）
- 191 users
- levtech.jp
- テクノロジー
- 2024/08/26
TOPインタビュー障害対応を属人化させない。「全員インシデントコマンダー」体制を根付かせた、山本五十六の格言【NewsPicks SRE 安藤裕紀】障害対応を属人化させない。「全員インシデントコマンダー」体制を根付かせた、山本五十六の格言【NewsPicks SRE 安藤裕紀】 2024年8月26日ユーザベース NewsPicks事業 SREチームリーダー安藤裕紀大手SIerで10年半エンジニア/アーキテクトとしてアプリケーション開発、インフラ構築、クラウド活用コンサルティングなど大企業の技術支援を行った後、2021年10月に株式会社ユーザベースに入社。プロダクト開発組織のSREチームでインフラや開発基盤を担当。シニアエンジニア、テックリードを経て、チームリーダーに。2024年からはプラットフォームエンジニアリングのグループマネージャーも兼務。 X Docswell GitHub
- sre
- あとで読む
- エンジニア
- 障害
- incident
- 開発
- 運用
- IT
- ドキュメント
- チーム
あなたの知らないKubernetesのServiceの仕組み | IIJ Engineers Blog
- 190 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2021/06/15
Kubernetesの主要なリソースの一つにServiceリソースがあります。ServiceリソースとはKubernetes上のPodへクラスタの外からアクセスするために使うもの、という理解をしている人が多いかもしれません。確かにそのような役割を担っているのですが、実際にはクラスタ内部に閉じた通信にも利用されていますし、実はもっといろいろな機能を持っています。端的に説明すれば、Serviceとは「ロードバランサとDNSサーバを設定するためのリソース」です。意外に聞こえますか？もし意外に思えたなら、ぜひこのまま読み進めてみてください。インターナルなロードバランサを制御する Kubernetesにはクラスタ内部に閉じた通信を制御するロードバランサが内蔵されています。Kubernetesを利用するということは、ほぼ例外なくこのロードバランサを利用しているのですが、あまり意識せずに利用されて
- kubernetes
- k8s
- あとで読む
- コンテナ
- IIJ
- loadbalancer
- service
スケールアウトの落とし穴から学ぶ、SREチームでのダッシュボードのアップデート術 - MonotaRO Tech Blog
- 189 users
- tech-blog.monotaro.com
- テクノロジー
- 2021/05/20
どんなことが起こったのか？モノタロウのサイトの監視についてレイテンシ監視トラフィック監視エラー監視リソース監視ログトラブルシュートの進め方発生検知発生箇所の特定根本原因の調査強化課題おわりに SREチームの市原(@ichi_taro3) です。モノタロウでは、www.monotaro.com という大規模なECサイトを自社で開発、運用しています。 Webアプリケーションの運用ではトラブルはつきものです。今回は、とあるトラブルシュート事例を軸に、どのように運用を改善しているのかについて紹介します。どんなことが起こったのか？あるとき、モノタロウのWebサービス全体でレイテンシ悪化やバックエンドAPIへのタイムアウトの増加が頻発したことがありました。当然これらは歓迎される状況ではなく、すぐに開発者やSRE、インフラチームの担当者が集まり調査を開始しました。現象は
- sre
- あとで読む
- 監視
- 運用
- infrastructure
- サービス
- インフラ
- performance
- サーバ
- tech
「Datadog入れてみたらAWSの料金が爆発した話」@ゆるSRE勉強会 #1
- 189 users
- speakerdeck.com/rynsuke
- テクノロジー
- 2023/08/29
ゆるSRE勉強会 #1 でお話しさせて頂いたLTの資料です！ https://yuru-sre.connpass.com/event/292063/
- aws
- あとで読む
- Datadog
- 運用
- sre
- cost
ITエンジニアの働き方を尊重し、技術的な成長を促進する開発組織に求められるものとは？ ──ユーザベースの取り組みに見る - はてなニュース
- 188 users
- hatenanews.com
- テクノロジー
- 2021/06/29
ITエンジニアが働く環境を選ぶ際に「技術的な成長が期待できるかどうか？」はとても重要な指標です。技術的な裁量が大きいことや学習機会が用意されていることだけでなく、チーム編成や評価といった仕組みの部分にまでエンジニアを尊重した文化が浸透していれば、その企業は極めて働きやすいと言えるでしょう。エンジニアが尊重される文化を醸成する仕組み作りの事例として、ペアプログラミングによる知見の共有を推し進め、プロダクトに導入する技術選択にもかなりの自由を持たせているユーザベースに、エンジニアを支える開発組織と企業文化について聞きました。今回は、スペシャリストとしてFellowの肩書きを持つ矢野勉さん（上記画像左下）と、入社2年目の廣岡佑哉さん（左上）にそれぞれの働き方を語ってもらい、CTOの林尚之さん（右上）には組織としての考え方をうかがいました（※取材はWeb会議ツールでリモート実施しました）。 ※
- エンジニア
- あとで読む
- 技術
- 開発
- 組織
- チーム
- 言語
- 会社
- 勉強
スタディサプリ最大のRailsアプリケーションにYJIT+pitchforkを導入してメモリ使用量を劇的に削減するまで - スタディサプリ Product Team Blog
- 188 users
- blog.studysapuri.jp
- テクノロジー
- 2024/04/02
こんにちは。SREのkyontanです。Rubyが大好きなのでRubyの話をします。ちなみにリクルートはRubyKaigi 2024へGold Sponsorとして協賛しています! *1。ぜひ沖縄でお会いしましょう。これはあるアプリケーションのメモリ消費量を示すグラフなのですが、まさかgemを入れ替えるだけでこんなに嬉しい変化が見られるとは思っていませんでした。今日はそんなgemの話をします。話は遡って2023年4月のある日、インターネットを眺めていたところ、ShopifyがpitchforkというOSSを公開したという情報が目に留まりました。調べてみると、どうやら著名なRackサーバー実装の1つであるunicornの派生版であり、メモリ使用量の削減に特化しているらしいのです。 github.com これはスタディサプリ小中高のあのリソースドカ食いマイクロサービス第一位である api
- rails
- あとで読む
- pitchfork
- ruby
- rack
- performance
- gem
- API
今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶ - Findy Tools
- 187 users
- findy-tools.io
- テクノロジー
- 2024/08/16
公開日 2024/08/16更新日 2024/08/15今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶはじめにアソビュー株式会社では、アソビュー！という電子チケットを販売するサイトを運営しています。システムを安定稼働させるためには、日常的にシステムの状態を監視して、問題があれば調整するというプロセスを繰り返すことが必要不可欠です。本記事では、アソビュー株式会社において、どのような体制でこの安定稼働を実現しているかということを書くことによって、同じようにシステムを安定稼働させたいと日々考えておられる方々を想定読者として、そのノウハウを共有しようと思います。安定稼働をするために必要な要素人間の健康管理のために必要なことシステムを安定稼働するために必要なことというのは、人間が健康に生きていくためにやっておいたほうがいいことと共通
- 監視
- 運用
- あとで読む
- サーバ管理
- monitoring
- SRE
- サーバ
- システム
- テスト
秘密情報には出どころも書いてくれ！頼む！ - KAYAC Engineers' Blog
- 184 users
- techblog.kayac.com
- テクノロジー
- 2022/12/11
SREチームの長田です。 KAYAC Advent Calendar 2022の11日目の記事です。アプリケーションから何かしらの外部サービスを利用するとき、そのサービスを利用するためのAPI Keyなり秘密鍵なりの秘密情報を保持することになります。暗号化したものをファイルとしてアプリケーションに持たせたり、 Amazon Web Services(AWS)ならAWS Secrets Managerや AWS Systems ManagerのParameter Store(SSM Paramater Store)に保存したものを実行時に読み込んだりするでしょう。これらの秘密情報、どこから来たのかわかりますか？どこから来た秘密情報なのか秘密情報を使って出どころを調べられるのであれば問題はないでしょう。 # 例えばAWSのIAM User Credenntialsとか $ AWS_A