[B! Infrastructure] ButterflyFishのブックマーク

Why reliability is hard at scale: learnings from infrastructure outages

This article digs into what happens when things go wrong at large-scale infrastructure providers. Last month, several well-known companies in this segment suffered widespread outages, and engineering teams later shared postmortems of what went wrong, and what they learned. Of course, many startups never get large enough to operate tens of thousands – never mind millions – of virtual machines (VMs)

ButterflyFish 2025/07/28

infrastructure

リンク

とあるインフラ屋のプルリクエストレビュー奮闘記 - NRIネットコムBlog

本記事は【プルリクウィーク】 2日目の記事です。 💻 1日目 ▶▶ 本記事 ▶▶ 3日目 📚 はじめに Git とインフラ屋と IaC そもそもインフラ屋が管理するコードとは？ IaC インフラ関連の設定ファイル CI/CD周りの設定ファイル PRレビューで難しいと思うこと何を持ってOKとするかそもそも検証が難しい網羅性が判断つかない PRレビューで意識していること静的チェックの導入コメントには意向を示す略語を付けるコメントがFixすればリアクションしてクローズする対面レビューの時間を設けるリリースとの親和性が高いさいごにはじめにこんにちは、加藤です。普段、私はインフラエンジニア（以下インフラ屋）としてシステム運用に携わっています。最近はIaCの普及もあり、インフラチームでもプルリクエスト(以下PR)レビューを実施しているチームが多いのではないでしょうか

ButterflyFish 2024/06/02

リンク

system-design-primer#system-design-interview-questions-with-solutions

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ButterflyFish 2023/10/29

リンク

Discord's Internal Infrastructure | Unofficial Discord API Docs

# Discord's Internal Infrastructure Taken off discord-infra (opens new window). # Disclaimer This has some degree of speculation as Discord's backend is closed. # Storage: Scylla (opens new window) for storage They used Cassandra (opens new window) for such but that changed (opens new window) They used Mongo DB (opens new window) as primary storage, but moved to Cassandra, source (opens new window)

ButterflyFish 2022/08/02

Infrastructure

リンク

これからのZOZOを支えるログ収集基盤を設計した話 / Log collection infrastructure to support ZOZO in the future

ButterflyFish 2021/12/29

リンク

カンムにおけるインフラの考え方をまとめた「インフラマニフェスト」のご紹介 - カンムテックブログ

カンムでバンドルカードのバックエンドやインフラを担当している summerwind です。バンドルカードではスマホ上で Visa のプリペイドカードを発行して決済に使える機能を提供しており、クレジットカード情報を扱っていることから、インフラの観点では高いセキュリティを維持することが重要になっています。バンドルカードのシステムは API や国際カードブランドと接続している決済システムなどの複数のコンポーネントで構成されていますが、システムが構築された時期によって構成や設定の方針などが異なるため、より高いセキュリティを達成するためにシステム構成の変更や整理、設定の見直しを日々進めています。構成や設定の見直しを進めていく中で、全体的な方針や目指している姿を言語化しておいた方が周囲のエンジニアにも理解が得られやすいのではないかと感じたため、インフラに対する考え方や方針を言語化した「インフラマニ

ButterflyFish 2021/06/18

リンク

知っておきたかったLinuxサーバ設計、構築、運用知識まとめ - hiroportation

サーバ業務周りの管理、運用について役に立ちそうなナレッジをまとめました。長期的に書いているため用語に統一性がなかったり、不足分など随時修正したいと思います。 1. サーバ設計サーバスペックはどうするべき？使用するOSは？ CentOS開発終了について MWは何を使うべきか Webサーバ構築にはどちらを使うべき？Apache？Nginx？サーバセキュリティで最低限押さえておきたいことは？ listenするポートは最小限にしましょうファイアウォール設定で送受信IPアドレス、ポートの通信制御はしておきましょう外部に出る際にはプロキシサーバを経由するようにする随時パッチを当てるようにする linuxでのアンチウイルスソフトの検討個人アカウントで変更系コマンドは実行させないようにするログについて考えることストレージ容量には気をつけるデータベースはどう決めたら良いか MySQLか

ButterflyFish 2021/05/08

リンク

【レポート】楽天の大規模決済システムを支えるAWSアーキテクチャ #AWSSummit | DevelopersIO

DA事業本部の春田です。 AWS Summit Online絶賛開催中！ということで、本記事では「CUS-65: ペイメントプラットフォームにおける AWS の活用」の内容についてまとめていきます。セッション情報楽天株式会社グローバルテクノロジー統括部國谷彩氏 AWS上でのPayment Platformシステムの歴史についてお伝えします。AWSへ移行してからこれまでの課題と解決方法について説明します。 ※セッション動画は以下リンクアジェンダ楽天グループについてペイメントプラットフォームについてペイメントプラットフォームにおけるアマゾンウェブサービス（AWS）の歴史楽天グループについて Eコマースのサービス「楽天市場」をはじめ、Fintech事業やエンターテイメント事業まで、さまざまなビジネスを展開各サービスが楽天共通IDで繋がることで、サービスを跨いだグループシナ

ButterflyFish 2020/09/27

リンク

DNSプロトコルのここ数年のトピック紹介

こんにちは、滝澤です。筆者の趣味として調べているDNSのプロトコルのここ数年のトピックについて紹介してみます。ほぼ毎年、DNSに関連する新しいRFC（インターネットに関する技術仕様）が公開され、仕様が更新されたり、新しい仕様が追加されたりしています。ここ数年のトピックについてまとめてみたいと思い立ち、この記事を書きました。なお、この記事は2020年8月時点での情報となります。すべてを網羅しているわけではありません。ちなみに、筆者は次のサイトを公開している人でもあります。 DNS RFCs ANYクエリーに対してRRsetをすべて返すわけではない 2019年1月に「RFC 8482 Providing Minimal-Sized Responses to DNS Queries That Have QTYPE=ANY」が公開されました。このRFCでは、DNSレスポンダー（DNSレ

ButterflyFish 2020/09/01

リンク

デプロイ今昔 - Hatena Developer Blog

こんにちは。はてなのアプリケーションエンジニアの id:onk です。最近、若手エンジニアを中心に、いろいろな技術を見つめ直すワーキンググループをやっています。今回は、その中から「デプロイ」の会で発表されたことをまとめました（なお、私は会のとりまとめをやっている非若手です）。デプロイのライフサイクルの違い Infrastructure Platformでのデプロイ Application Runtime Platformでのデプロイ Applicationsのデプロイデプロイ方式はどのように変化してきたか In place から Blue/Green へ Immutable Infrastructure という考え方オートスケールへの対応 push 型デプロイと pull 型デプロイコンテナによるデプロイの現況コントロールプレーンによって何が変わったか ECS におけるデプロイ

ButterflyFish 2020/06/26

リンク

プロセスのオーナ情報をTCPオプションヘッダに書き込むに至った背景とアプローチの補足 - 人間とウェブの未来

hb.matsumoto-r.jp 上記のリンクの昨日書いた記事のスコープや前提、及び、ユースケースがわかりにくかったので、以下にそれらをもう少し詳細に書こうと思います。コメントやアドバイスをすでに頂いた方はありがとうございます。まず、この手法にいたった課題について説明してきます。これまでWebホスティングサービス(レンタルサーバ)のように、WordPressのようなWebアプリケーションを配置するための領域(一般ユーザで利用するテナント)を貸し出すようなプラットフォームサービスにおいて、低価格化を実現するために単一のサーバにどれだけ高集積にテナントを収容するかという検討がなされてきました。そんな中、テナント単位でプロセスを用意したり、IPアドレスをはじめとした個別リソースの紐付けを極力行わずに、共有のデータベースミドルウェアを使い、できるだけリソースを共有するような方式、例えばAp

ButterflyFish 2020/06/07

リンク

コンテナ目線で考えるUnikernelとmicroVM / MicroVM and Unikernel in the container world

ButterflyFish 2020/06/07

リンク

Infrastructure as Codeにおける理想のドキュメント管理を目指して #infrastudy | DevelopersIO

インフラをコードで管理するInfrastructure as Codeだからこそ、必要なドキュメントについての考察とそれの管理方法についてLTした様子です。「なんや、この視聴者数…　震えが来るぜ・・・」先日開催されたInfra Study Meetup #2「VM時代の開発とCloud Native時代の開発」 - connpassにおいて、「IaCにおける理想のドキュメント管理を目指す」という内容でLTしてきましたので、その内容をお届けします。当日は、イベント内容も登壇者も超絶豪華で、なんとリアルタイム視聴者数1000人超えということで、さすがに自分も緊張しました。まじで。青山さんのメインテーマがKubernetesの話であり、前後それに関わるテーマが中心の中、Kubernetesもコンテナも1ミリもでてこない発表にしたのですが、IaCに関わる普遍的な考慮ポイントについて喋れたの

ButterflyFish 2020/06/01

リンク

Infrastructure as Dataとは何か

最近GCPから登場したKubernetes YAMLのPackage managerであるKptは「Infrastructure as Data（Configuration as Data）」という考えかたを基礎としてそれを推し進めようとしている．それ以外にもKubernetesのEcosystemには（明示はされていなくても）この考え方が中心にある．Infrastructure as Codeとは何が違うのかなど歴史を振り返りつつまとめてみる．（指針はBorg, Omega, and Kubernetesという論文にあるが「Infrastrcuture as Data（Configuration as Data）」という言葉を明確に定義した文章はない．この記事はReferencesに挙げるいくつかのPodcastにおける@kelseyhightowerの発言や，それに反応する@bgra

ButterflyFish 2020/05/12

リンク

分散アプリケーションの異常の原因を即時に診断するための手法の構想 / Causality Tracing in Distributed Applications

ButterflyFish 2020/05/08

リンク

Infrastructure as Codeのこれまでとこれから/Infra Study Meetup #1

A method for separating policy definition and behavior control by an intermediate language to achieve optimal server configuration management according to the situation

ButterflyFish 2020/04/24

リンク

【Developers Summit 2020フォローアップ】グランブルーファンタジーを支えるサーバーサイドの技術

こんにちは。サーバーサイドエンジニアの小松・大橋です。 2020年2月13日・14日に開催された「Developers Summit 2020（デブサミ2020）」において、『グランブルーファンタジーを支えるサーバーサイドの技術』と題した講演を行いました。ご参加いただいた皆様、当日は素晴らしい時を共有させていただき、ありがとうございました。なお、この講演はWebメディア「CodeZine」でも取り上げていただきました。ご興味のある方はご参照いただければと思います。講演資料はこちらになります。本稿では、講演でお伝えし切れなかったことや、質問を多くいただいた事項をフォローアップしていきます。中長期的な改善の意義について講演では、中長期的な改善の意義についてお話ししました。我々にとって最も大切なのは、お客様に快適にプレイしていただくことです。そして、トラブルを未然に防ぐことも目的の一

ButterflyFish 2020/03/27

リンク

性能と性能測定の基礎 - 覚書

はじめにコンピュータの世界では「性能」および「性能測定」という言葉があります。これらの言葉にはたくさんの意味があるのですが、業務システムの構築、運用にかかわったような人でなければ、「PCの新しいパーツに対して様々なベンチマークソフトウェアを走らせること」が性能測定であり、その結果得られるものが「性能」といったところでしょう。本記事ではそれ以外の、業務システムにおける性能や性能測定について述べます。性能ひとくちに性能といっても、さまざまな指標があります。代表的なものは「スループット」、「IOPS」、そして「レイテンシ」です。これらについてストレージデバイスを例に説明します。スループットは単位時間あたりにどれだけのデータを送受信できるかであり、XX MB/sやYY GB/sのようにあらわします。性能といって一番イメージしやすいのはこれでしょう。スループットが重要な意味をもつのは大きなデ

ButterflyFish 2020/03/09

リンク

「海外21拠点を1人でサポートし3年間残業ゼロ」を実践したネットワーク監視の匠が語る「AIOps」の効果とビジョン

「海外21拠点を1人でサポートし3年間残業ゼロ」を実践したネットワーク監視の匠が語る「AIOps」の効果とビジョン：特集：AIOpsとは何か（3）（1/2 ページ）システムの安定した稼働を守ることが求められる「IT運用」の現場において「AIOps」による業務の自動化、効率化への関心が高まっている。商社のインフラサポートエンジニアとしての職務経験の中で、自ら機械学習を応用した遠隔サポートシステムを開発した園山淳也氏に「AIOps」の有効性や未来像を聞いた。さまざまな領域で注目を集める、機械学習やディープラーニングなどを応用した「AI」と総称される情報処理技術。これらが、最も早く適用され始めているのが、これまで「人間にしかできない」とされていたような判断や作業を、高速かつ高精度に行う「自動化」の領域だ。ビジネスとITとの関係が不可分なものになり、ITの重要性が高まり続ける中で、システムの安