[B! 運用] yamadarのブックマーク

AWSで”最小権限の原則”を実現するための考え方 /20240722-ssmjp-aws-least-privilege

ssmonline #43 での発表資料です。 (運用設計ラボ合同会社波田野裕一)

yamadar 2024/07/24

リンク

「みんなで金塊堀太郎」という施策で億単位のコスト削減を達成 & 表彰されました | CyberAgent Developers Blog

CTO統括室の黒崎(@kuro_m88)です。サイバーエージェントのエンジニアを中心に直近の半年で「みんなで金塊堀太郎」という施策を行い半年で億単位のコスト削減を実現できたので、どんなことをしたのか紹介します。また、社内の半期に一度の全社表彰で表彰されたので、サイバーエージェントの表彰の文化についても触れたいと思います。「みんなで金塊掘太郎」とは？メディア事業管轄で「金塊堀太郎」という施策を過去実施しており、それを全社に展開したのが「『みんなで』金塊堀太郎」という施策です。具体的には、社内のエンジニアが主体となって主にシステムコスト削減のアイデアを出し合い、それを実行するものです。「金塊堀太郎」という名前の由来は把握していませんが、社内Slackに絵文字があり一定の知名度があったと思われるため、全社展開においてもこの名前が採用されました。社内の偉い人たちが真顔で「金塊堀太郎が〜」と

yamadar 2024/04/12

コツコツとした運用コストの削減を継続的に重ねていくための仕組みづくり的な話。とても良い。

リンク

Gmailの新スパム規制対応全部書く

[2024年1月10日、19日追記] GmailとYahoo!側のアップデートに合わせていくつか細かい説明を追加しています（大筋は変わっていません）。変更点だけ知りたい方は「追記」でページ内検索してください。 2023年10月3日、Googleはスパム対策強化のため、Gmailへ送るメールが満たすべき条件を2024年2月から厳しくすると発表しました。また米国Yahoo!も、2024年2月第一四半期[1] から同様の対策を行うと発表しています。端的に言えば、この条件を満たさないと宛先にメールが届かなくなるという影響の大きな変更です。この記事では、Gmailや米国Yahoo!の規制強化への対応方法を解説します。ただし米国Yahoo!にメールを送る人は多くないと思うので、フォーカスはGmail寄りです。また、メール配信サービス（海外だとSendGridやAmazon SES、国産だとblas

yamadar 2023/12/09

リンク

ソフトウェアはなぜバージョンアップしなければならないのか - Qiita

はじめに社内インフラの運用担当者にとってソフトウェアのバージョンアップは地味な割に大変な業務です。特に社内のオンプレサーバで動いているようなソフトウェアの場合、バージョンアップに伴う諸々の調整をそのソフトウェアを利用している各部署と行う必要があります。そんなときに「今は忙しいからバージョンアップを先送りしてほしい」「このバージョンはスキップしてもよいのでは？」なんて声が各部署から聞こえてきます。バージョンアップの価値を各部署に理解してもらうのは大変です。この文章はそんな時になぜバージョンアップしなければならないのかを上司や各部署のマネージャに伝えるために書きます。ソフトウェアの有効期限は2-5年まず、第一に、ソフトウェアというものは無限に使えるわけではなく、一定の有効期限があり、それを過ぎると徐々に動かなくなってきます。俗にいう「何もしてないのに動かなくなった問題」です。なぜ

yamadar 2023/07/30

この辺をお金握ってる人が理解してないと大変なことになる。（今ちょうど検出された脆弱性の対応を纏めていた所）

運用

リンク

寿命迫るボイジャー2号、電気系の変更で科学機器運用を2026年まで延長。引き続き星間空間のデータを取得 | テクノエッジ TechnoEdge

ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 1977年に打ち上げられたボイジャー2号は、地球から200億km以上離れた星間空間を飛行していますが、現在も科学機器を用いて取得したデータを我々の元へ送り続けています。しかし、45年を越えて続くミッションもそろそろ終わりが見えてきています。と言うのも、ボイジャーが搭載する放射性同位体熱電発電機(RTG)からの電源供給が終わりに近づいているから。ボイジャー2号はすでに、消費電力を節約するため、飛行に不可欠ではないヒーターなどの一部システムをオフにしていますが、それでも早ければ2024年には5つある科学機器のうちひとつを停止しなければならない段階に達していました。ボイジャーに搭載されるRTG (NASA/J

yamadar 2023/04/28

設計がすごい

リンク

最近のDHH「サーバーレスをやめろ」 - laiso

(インターネットやめろジェネレーターで作成) Ruby on Rails生みの親であり最強の逆張りおじさんであるところのDHHが昨年あたりからしきりに脱パプリッククラウドの主張をしている。これは彼らの会社が運用しているBasecampやHEYのインフラをAWSから自社保有のベアメタルサーバーへ移行しようとしているからで、実際に移行作業は進んでおり、今後5年間で700万ドルのサーバー費用を節約できるだろうという見込みがあるようだ。 world.hey.com world.hey.com あとタイトルに「サーバーレスをやめろ」と書いたけどDHHのファンボである筆者の誇張表現であり、サーバーレスというキーワードに関しての言及は正確には以下のポストを読んで欲しい。 world.hey.com この文章における「the computing cycles」とは、一台のコンピュータが持つ計算能力全体を

yamadar 2023/03/02

大規模でコスト最適化するとそうかも

リンク

「一線」を越えた自宅サーバー管理者のあなたへ。よく使うルーターやサーバーを集めたダッシュボードを「Dashy」で作る【イニシャルB】

yamadar 2023/02/06

逸般の誤家庭だ...

リンク

インフラエンジニアって何してんの？ - Qiita

「ラクス Advent Calendar 2022」 12月23日（金）担当のインフラエンジニアです。今回は知られざるインフラエンジニアの仕事について触れてみたいと思います。はじめに最近（でもないけど）twitterなどで駆け出しエンジニア？の方のツイートをよく目にするようになりました。「駆け出しエンジニア」というと文字面からは1年目のなりたてエンジニアのような印象を受けますが、どちらかというとこれからエンジニアを目指すために勉強をしている方を指すことが多いようです。そういった方のツイートを見ていると9割以上はプログラミングの話。実際に業界内で働いてみれば要件定義など単純にプログラミングしていればいいだけの世界ではないことは重々承知かと思いますが、未経験の方にはエンジニア＝プログラミング、エンジニア＝開発、というイメージがやはり強いのでしょう。はたまたインフラエンジニアなんて世界に

yamadar 2022/12/25

リンク

Next.jsアプリをVercelからGoogle Cloudに移行した話

ZennではフロントエンドにNext.jsを使っています。もともとはVercelで動かしていたのですが、2021年3月にGoogle Cloudに移行しました。今回は移行を決めた理由や、具体的な構成、移行作業などについて書きたいと思います。なぜ移行したのか Next.jsのデプロイ先としてVercelは圧倒的に優れています。ISRやImage OptimizationといったNext.jsの強力な機能をサーバー側の追加設定なしで使用できますし、CDNでの静的ファイルのキャッシュなども特に意識しなくてもいい感じにやってくれます。 Vercel以外にデプロイするとなると、Next.jsの一部の機能がうまく動かなかったり、パフォーマンス・チューニングを自分で頑張る必要があったりと自分で面倒を見なければならない部分が多くなります。しかし、Zennのケースでは以下のような理由からVercelから

yamadar 2022/07/19

リンク

障害報告書を書こう！ - Qiita

担当しているITサービスなどに何かしらのインシデントや障害が発生した時に、対処後のアクションとして報告書を提出して事象の内容を報告（レポート）する場合がある。提出先は会社の偉い人だったりクライアントだったり。場合によってはユーザー向けに発表したり。事の顛末を報告して「今後同様のことを起こさないように努力します、ごめんなさい」をするのだ。どのように再発防止の努力するのかを書くものでもある。主にクライアント向けのビジネス内容ではあるが、自分が使っているテンプレパターンを共有するので参考にしてもらえればと思う。1 全般的なポイント心得のようなもの。次の点は留意してて欲しい。淡々と冷静な説明をこころがける当然のことながら事実は脚色しない。無駄な修飾も要らない。客観的な事実を簡潔に述べる。例： ❌「一生懸命頑張って対応したが…」 ❌「寝ないで対応したが…」 ❌「本当の原因は…」できるだ

yamadar 2022/07/05

リンク

「エーペックス」の仕組み:開発者によるサーバーとネットコードの解説

これは、とある「エーペックス」のプロプレイヤーのネットワーク経路（レイテンシーを表示しています）です。彼のインターネットモデムから、私たちのサーバーへと到達しています。インターネット接続の本当の状態を判断するため、私たちは何度も調査を行います。最善の状態であれば、彼は31msのレイテンシーでゲームを楽しめていることが見て取れますね。ですが最悪の場合だと、522ms付近です。つまりこの場合だと、接続に500msもの振れ幅があるため、ゲームの遊び心地はかなり悪いということです。彼のローカルISPネットワークの接続は不安定ですが、平均を見てみると非常に稀なケースであることがわかります（平均が31mで、最低値が264ms。たまたま起きたのでしょう）。しかしその後、ローカルのISPとISP1の間でレイテンシーが急増しています。これはプレイヤーとゲームサーバーの間のノードの一つです。この二つの間でパケ

yamadar 2021/05/06

ゲームにおける遅延に対する考え方、取り組みについて。興味深い。

リンク

Amazon ECS でのコンテナデプロイの高速化

Amazon ECS でのコンテナデプロイの高速化この記事は同僚の Nathan Peck (@nathanpeck)が書いた記事 “Speeding up Amazon ECS container deployments” を翻訳し、加筆・修正したものです. 元記事を ECS ユーザに紹介する機会が何回かあったので、せっかくなので翻訳することにしました. コンテナのオーケストレーションは非常に複雑な問題の一つです. アプリケーションコンテナのデプロイのために、相互にやり取りを行う複数の異なるコンポーネントが存在します. あなたのアプリケーションを実行したオーケストレータは、その実行されたアプリケーションが Web トラフィックを受け取る用意ができているかどうかについて判断する必要があります. その後そのアプリケーションはスケールダウンされたり、あるいは新しいバージョンのアプリケーション

yamadar 2021/04/20

リンク

あと2時間でElastiCacheのメモリが枯渇！そのときあなたは何をしますか？

突然ですが... あなたは、あるゲームプロジェクトの本番リリース2日前にサーバエンジニアとしてJOINしました。いざリリースを迎えたとき、ElastiCacheのメモリが突然危険域を超え、さらにあと2時間で枯渇しそうな状況になりました。さて、この状況におかれたあなたは何をしますか？はじめにモバイルゲームのシステムは新しいイベントをopenするとトラフィックが2倍、3倍、時には普段の10倍以上来ることがあり、トラフィックの変動が非常に大きい特性があります。新しいゲームのリリース時はより顕著で、想定以上のトラフィックが来ることもしばしばあります。この記事は、あるゲームプロジェクトの本番リリース時に大規模トラフィックが来た際のサーバトラブルを題材に、どのような観点で問題を切り分けていったのか、トラブルシュートのプロセスどのような準備(負荷テスト)をしていれば防げるのかという話をし

yamadar 2020/12/18

だいぶ実践的。

リンク

AWS システム構築非機能要件ヒアリングシートを公開してみた | DevelopersIO

こんにちは。ご機嫌いかがでしょうか。 "No human labor is no human error" が大好きなネクストモード株式会社の吉井亮です。日本国内においても多くのシステムがクラウド上で稼働していることと思います。俊敏性、拡張性、従量課金、IaS、セキュリティなどクラウドのメリットを享受しやすい所謂 SoE で多くの実績があるように感じます。ここ1~2年は、社内基幹システム・情報システム、SoR 系のシステムのクラウド移行が本格化してきたというのが肌感覚であります。クラウドでのシステムインフラ構築は従来のようにゼロから非機能要件定義を行っていくものではなく、ベストプラクティスをまず実装して少しずつ微調整を行っていくものと考えています。とはいえ、システムごとの要件は予め明らかにしておくことがインフラ構築においても重要になります。クラウド上では出来ること出来ないこと

yamadar 2020/07/28

リンク

「ほんまに運用できるの？」毎秒6000イベントをミリsec対応するウェブサービスを、マルチクラウドで構築した話を聞いてきた #devsumi | DevelopersIO

「ほんまに運用できるの？」毎秒6000イベントをミリsec対応するウェブサービスを、マルチクラウドで構築した話を聞いてきた #devsumi 最近、結構な頻度で聞くようになってきた「マルチクラウド」という単語。いろんなクラウドの良いとこ取りができるのでメリットしかなさそうだけれど、運用・保守面含めて、「そんな簡単じゃないやろ〜」と一歩引いた視点で自分はみていました。恐らく、Developers Summit 2018において、マルチクラウドというテーマで話されていたのは、このセッションだけじゃないでしょうか。結論から言うとすっごい面白かったです。マルチクラウドで構成組む時に必ず出てきそうな問題点の解説もあり、非常に貴重なノウハウが満載なセッションでした。 __ （祭） ∧ ∧ Y　 ( ﾟДﾟ) Φ[_ｿ__ｙ_l〉ﾏﾙﾁｸﾗｳﾄﾞﾀﾞﾜｯｼｮｲ |_|＿| し'´Ｊ講

yamadar 2018/02/19

リンク

もう管理画面のフロントコードを書く必要はありません、そう Viron ならね。 - Qiita

管理画面のフロントエンドコードを書く時代は終わりました。 Vironがあれば、OpenApi(Swagger)でAPI定義を行い、実装するだけで管理画面が完成します。そしてこれはOSSです。誰でも自由にお使いいただけます。概要 Vironは、複数の管理画面を管理できるよう設計された、管理ツールマネージメントコンソールです。 APIサーバーとOAS2.0 jsonファイルを作成するだけで、管理画面が一つ完成します。経緯私の会社では、大小さまざまな自社サービスが開発・運用されています。管理画面をサービス・サイト毎に作っていましたが、それには限界がありました。エンジニアからしたら、管理画面用のデザインやAPIを作らなきゃいけない。工数がかかる。運用・プロデューサーは、UI・UXが管理画面で違うため、操作を覚えるという学習コストが高い。さらに外から見たいときにスマホから見れないし、

yamadar 2018/02/02

後で中身見てみる

リンク

CSS 設計の長い夢 - ペパボのフロントエンドスタンダード

フロントエンド周りの技術は驚異的なスピードで進化し、また多様化しています。それらを全てマスターするのは途方もなく大変なので、ペパボでは、社内のエンジニア・デザイナが「最低限これだけはおさえておこう」というスタンダードを文書化することにいたしました。社内向けを想定した文書ではありますが、社内のみに留めず多くの方に役立てたいと考えたため公開します。スタイルシートの夢 (1) 予測しやすい (2) 再利用しやすい (3) 保守しやすい (4) 拡張しやすい代表的な CSS 設計手法既存プロジェクトの CSS に立ち向かう！ (0) 流れ (1) 既存の CSS ファイルを元に SCSS ファイルに変換する (2) イニシャライズ CSS や共通の箇所のスタイルを分離する (3) CSS Lint を使って、修正しやすいところから整理していく (4) コンパイル (5) スタイルのスコープ（あ

yamadar 2015/06/11

リンク

Redmineチューニングの実際と限界 - Redmine performance tuning

Redmineチューニングの実際と限界(旧資料) - Redmine performance tuning(old), See Below.

yamadar 2015/05/17

リンク

fluentdでつくる監視系 - Qiita

いつもアプリケーションの開発ばかりで、まじめに監視系を考えたことがなかったので、 fluentdを中心にした監視系を作ってみた。前提複数台のアプリケーションサーバ一台のログ収集サーバログにはエラーログとアクセスログの大きく2種類を用意するエラーログは更に複数のレベルでファイル単位にわかれている fatal error warn アプリケーションサーバとログ収集サーバは同一ネットワーク上にあるやりたいことメールで来ても絶対に気がつかない自信がある。異常の側から教えてくれる仕組みを目指す。 fatalログが出た場合は、電話による通知を行う全てのエラーログはchatツールに出力するログのバックアップログの分析・可視化この記事では1, 2, 3についてまとめる。構築 fluentdのインストール公式のドキュメントが一番わかり易い。 Installation | Flue