Looking for Datadog logos? You can find the logo assets on our press page.
こんにちは、JapanTaxi SREチームの水戸です。 インフラからアプリケーションまでサービスの安定性向上のための改善を日々行っています。 今年9月のリニューアルで、JapanTaxiアプリ向けのAPIにGraphQLを導入しました。この記事では実際にGraphQL導入したことで感じたメリットと課題を書いていきたいと思います。 現在のJapanTaxiアプリにおけるGraphQLの導入状況 今回は数年間開発を続けてきたアプリのリニューアルプロジェクトということで、既存部分を使いまわしている部分も多々あり全てのAPIを一斉に置き換えるのは難しい状況でした。そのためリリース時点ではアプリの変更に合わせて改修が必要になった参照系のAPIにのみGraphQLを導入しました。 リリース後は順次RESTからGraphQLに切り替えを進めており、一部では更新系でもGraphQLを使い始めています。
この記事はSREアドベントカレンダー1の4日目 (12/4) の記事となります。SRE的事案に追われつつ、なんとか当日に間に合いました。 突然ですが、サイト信頼性を向上させるために重要なことは何でしょう。私が最も重要だと思うことは「システムから祈りを無くすこと」です。 「そろそろこの機能が限界迎えそうだけど、実感はないからまだ大丈夫なはず。不安だけど。。。」という祈るようなモードの時は大抵障害が起きます。残念ながら悪い方向には皆さんの感覚は正しいのです。 私の所属するチームでは、直近の目標の一つとして「メトリクスを元に改善活動ができるようにする」ことを掲げ取り組んできました。これは、前述の「システムに祈る」というエモーショナルな行動を「メトリクスを元に判断する」というロジカルな行動に変える為の取り組みです。 今回は、どのようにデータを収集しているかをかいつまんでご紹介します。内容は割と初歩
これは SRE Advent Calendar 11日目の記事です。 こんにちは、Backlog の SRE を担当している吉澤(Muzi と呼ばれている人)です。 本記事では、SRE Lounge #5 で講演した際に、時間の都合で省略した「ヌーラボ社内での Backlog のサービスレベル計測とその結果の活用」についてご紹介します。 長年運用されてきたサービスを改善するために、SRE ができる取り組みの一例としてご参考ください。 SRE とは? SRE とは、Site Reliability Engineering の略です。これは Google で初めて提唱された概念で、その提唱者自身は著書「SRE サイトリライアビリティエンジニアリング」(いわゆる「SRE 本」)のなかで以下のように述べています。 Google 内で規定されることになったサイトリライアビリティエンジニアリングとは、
はじめに 本記事はSRE 2 Advent Calendar 2018の11日目の記事です。 SRE 2 Advent Calendar 2018 - Qiita dely Advent Calendar 2018もやっていますので目を通していただけると嬉しいです。クラシルの秘話がたくさん書かれています。 dely Advent Calendar 2018 - Adventar dely Advent Calendar 2018 - Qiita こんにちは!delyでSREをやっている井上です。 SREのみなさん!インフラコストの最適化してますか? delyはどうかというと、正直まだまだ不十分な状況です。。。 クラシルでまだまだやりたいこと・やるべきことがたくさんあり、コスト最適化の優先順位がなかなか上がりにくいのが現状です。 ちなみについ先日クラシルに待望の献立機能がリリースされました!
※ この記事は SRE Advent Calendar 16日目の記事です。 皆さんこんにちは。エムスリーという会社でSREをしている高橋です。 早いもので、今年ももう終わりですね... ! そこで本記事ではエムスリーのSREチームがこの1年の間に実施してきたSLO設定及びSLO超過監視活動を反省とともにご紹介していきたいと思います!! エムスリーにおけるSREチームの成り立ち かつてはSREがインフラチーム配下のポジションとして存在しているような状況でしたが、肩書は違えど作業内容はほとんど同じだったので、2018年7月からインフラチームがまるっとSREチームへと改称されました。 www.m3tech.blog SLI/SLO設定/監視 SREとしての活動を考えたときに、まずはサービスレベル目標(SLO)を決めてサービスの品質を改善していきたいと思いました。そこで、まずはサービスレベル指標
SRE Advent Calaendar 1日目の記事です。 qiita.com SRE Advent Calaendar 1 がすぐ埋まってしまったので、SRE Advent Calaendar 2 もあります。 qiita.com 本記事では、SREのみなさんに向けて、監視システムの特徴から考える監視設計のポイントをお伝えします。 SREと監視 SREのみなさんにとっては当たり前すぎると思いますが、SREと監視は切っても切り離せない関係にあります。 SREのお仕事は、サービスの信頼性を維持・向上させることであり、そのためには信頼性を計測しなければなりません。 モニタリング?監視? さて、SREの文脈では、度々、「モニタリング」というキーワードが登場します。 モニタリングと監視は、どのような関係性にあるのでしょうか。 私の解釈は、以下です。 - 監視: 状態を見張ること - モニタリング
D 社のみなさん、こんばんみのる〜。 ゆいかおりです〜。 さて、Red Hat Enterprise Linux 7 のドキュメントにこんな記述がありました。 NTP が示すのは、1900 年 1 月 1 日の GMT 午前 0 時 00 分からの積算秒数です。秒数のカウントには 32 ビットが使われているので、時間は 2036 年に 「ロールオーバー」 してしまいます。しかし、NTP はタイムスタンプ間の差異で機能するため、タイムプロトコルの他の実装ほどの問題はもたらされません。誤差が 68 年以内のハードウェアクロックが起動時に利用可能であれば、NTP は正確に現在の日時を解釈します。NTP4 仕様は、 「Era Number」 および 「Era Offset」 を提供します。これらは、68 年を超える長さの時間を処理する際に、ソフトウェアをより堅牢にするために使用できます。この問題を
こちらはグロービスアドベントカレンダー25日目の記事です。グロービスは国内では最大規模のビジネススクール/経営大学院を運営している会社で、私自身もグロービス経営大学院のMBAに通っているので、この記事では私が学んだMBAスキルの中でエンジニアの皆さんにも役に立つであろう知識・フレームワークをピックアップしてご紹介します。 1. 正しい意思決定をするスキル まずは正しい意思決定をする為のスキルです。顧客が本当に欲しかったものを作り上げる為にも、エンジニア側も交渉力・調整力を持つ事が重要です。 1-1. 交渉力としての「ZOPA」と「BATNA」 ZOPA(ゾーパ)とBATNA(バトナ)と呼びます。ZOPAは Zone Of Possible Agreement の略で、お互いに交渉が締結できる範囲のことを示し、BATNAは Best Alternative To Negotiated Agr
scalar型を新しく定義するためにはscalarキーワードを使います。例えば、Date型を新しく定義するには次のようにします。 scalar Date スキーマではこれだけですが、実際に使う際はGraphQL処理系に対してさらにシリアライズとデシリアライズを定義することになります。 GraphQL組み込みのscalar型は先にあげたものだけなので、例えばバイナリ、日付と時刻、HTML/XML、BigIntなどを必要に応じて追加することになるでしょう。ただしその場合、サーバーサイドとクライアントサイドでシリアライズ・デシリアライズの実装を一致させる必要があります。 Enum enum(イナム)はscalar型の一種で、特定の値のみを持つ型です。例えば、組み込みscalar型であるBooleanをenumで宣言すると次のようになるでしょう。 enum Boolean { true false
2016-2017年でのNIST SP800-63-3改定を通じて、認証を含むデジタルアイデンティティの世界では様々な議論が湧き起こりました。 そんな本ガイドラインの内容を通じて、デジタルアイデンティティフレームワークを考える上での共通言語、特に「認証方法」について記載したNIST SP800-63Bについての理解と体得を試みつつ、議論になったいくつかのテーマについて取り上げて、この領域の面白さに触れてみます。 [rev3] 2022年1月までのアップデートを追加して、個別依頼を受けて実施したプライベートセミナー向けの版をサニタイズしてアップロードしました。〆切ドリブンで改定機会をくださった会社様には感謝です。 主な改定 ・SMSへの攻撃としてSS7とSakari/Bandwidth社の事例 ・よくある追加認証のトピックス ・アカウントリカバリの文言改善(解釈文書を元に) ・NIST SP
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog はじめに こんにちは。 ヤフー株式会社 データ&サイエンスソリューション統括本部データプラットフォーム本部データデリバリー部の井島&大戸です。 今回は、ヤフー株式会社(以下ヤフー)が OSS として公開したカラムナストレージファイルフォーマットの Multiple-Dimension-Spread について、開発の背景を交えて紹介します。 Multiple-Dimension-Spreadとは Multiple-Dimension-Spread(以下MDS)はヤフーが開発したカラムナストレージフォーマットです。 大規模なデータを蓄えておく仕組みを湖として捉えたものをデータレイクといいます。 MDS はデータレイクにデータを保存、利
Amazon Web Services ブログ AWS データストア内の機密データを保護するためのベストプラクティス クラウド内の機密データを保護するための効果的な戦略を立てるには、一般的なデータセキュリティパターンをよく理解し、これらのパターンを明確にマッピングしてクラウドセキュリティコントロールに活かすことが必要です。その後、これらのコントロールを Amazon Relational Database Service (Amazon RDS) や Amazon DynamoDB などのデータストアに固有の実装レベルの詳細に適用できます。 このブログ記事では、データを保護する一般的なデータセキュリティパターンとそれに対応する AWS セキュリティコントロールに焦点を当てます。この記事では Amazon RDS と DynamoDB について説明しますが、Amazon RDS と Dyna
はじめに こちらは、ZOZOテクノロジーズアドベントカレンダー 20日目の記事です。 KubeConに参加したSREチーム所属のへっぽこエンジニア@inductorが、2日目のKeynoteであるAirbnbの事例をみて学んだことをまとめます。 KubeConの当日の様子は、僕個人のブログや、弊社テックブログに後輩がまとめていますので、そちらもご覧ください。 TL;DR 1年前にK8sを導入していまやサービス全体の40%のアプリケーションがK8s上で動いてる 多数のマイクロサービス・チームを抱えるため、Kubernetesの管理に必要なYAMLの生成を自動化している アプリケーション本体とインフラ構成管理を同じプロジェクトで管理することで構成管理が腐らないように仕組み化されている CIでLintやバリデーション、アプリケーションのデプロイとKubernetesのPodの立ち上げを一本のパイ
このエントリーは、GMOアドマーケティング Advent Calendar 2018 の 【12/25】 の記事です。 GMOアドマーケティングとしては初のAdvent Calendar参戦です。 こんにちは。GMOアドマーケティングの佐藤です。弊社では今年3つのマイクロサービスにKubernetesを導入しました。minikubeのローカル環境で開発、ステージング環境でテスト後、本番環境にデプロイします。弊社ではGKEを使っていますが、ローカルではうまくいっても、本番にデプロイした際に、いくつかのトラブルに見舞れることがありましたので、その内容と解決方法を共有できればと思います。 1. Preemptive VM Instanceが買えない場合がある 広告のサービスはピーク時間帯とアイドル時間帯でアクセスが10倍以上違う場合があるため、アクセスに応じてオートスケールするように設定していま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く