opsの人気記事 102件 - はてなブックマーク

1 - 40 件 / 102件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

opsの検索結果1 - 40 件 / 102件

opsに関するエントリは102件あります。運用、 aws、開発などが関連タグです。人気エントリには『AWS システム構築非機能要件ヒアリングシートを公開してみた | DevelopersIO』などがあります。

AWS システム構築非機能要件ヒアリングシートを公開してみた | DevelopersIO
- 1152 users
- dev.classmethod.jp
- テクノロジー
- 2020/07/27
こんにちは。ご機嫌いかがでしょうか。 "No human labor is no human error" が大好きなネクストモード株式会社の吉井亮です。日本国内においても多くのシステムがクラウド上で稼働していることと思います。俊敏性、拡張性、従量課金、IaS、セキュリティなどクラウドのメリットを享受しやすい所謂 SoE で多くの実績があるように感じます。ここ1~2年は、社内基幹システム・情報システム、SoR 系のシステムのクラウド移行が本格化してきたというのが肌感覚であります。クラウドでのシステムインフラ構築は従来のようにゼロから非機能要件定義を行っていくものではなく、ベストプラクティスをまず実装して少しずつ微調整を行っていくものと考えています。とはいえ、システムごとの要件は予め明らかにしておくことがインフラ構築においても重要になります。クラウド上では出来ること出来ないこと
みずほ銀行システム障害に学ぶ
- 997 users
- ja.kohsuke.org
- テクノロジー
- 2021/06/17
みずほ銀行システム障害の調査報告書が公開されたのがニュースになって、Twitterなどで色々な人がコメントをしているのを見た。140文字しか書けない空間で他人の失敗談の揚げ足取りをするのは簡単だが、そこからは一時の爽快感以外に何も得るものがないので、僕はそういうのはカッコ悪いと思っている。そこで、ちゃんと読んでみたら全く他人事でない部分も沢山あるし、非常に面白く勉強になったので、ブログにまとめてみる。技術的な話銀行のシステムがどのようになっているのか、全然イメージが湧いていなかったので、それがまず勉強になった(p.29)。トラフィックのソースに応じて用意された色々なシステムから基幹システム「MINORI」の取引メインバスにトラフィックが流れ、そこから各種システムへとリクエストが送られていく。この辺はService Oriented Architectureらしい。開発当時としては（
- 障害
- あとで読む
- システム
- 開発
- IT
- development
- 運用
- 銀行
- セキュリティ
- 仕事
障害報告書を書こう！ - Qiita
- 840 users
- qiita.com/Ping
- テクノロジー
- 2022/07/04
担当しているITサービスなどに何かしらのインシデントや障害が発生した時に、対処後のアクションとして報告書を提出して事象の内容を報告（レポート）する場合がある。提出先は会社の偉い人だったりクライアントだったり。場合によってはユーザー向けに発表したり。事の顛末を報告して「今後同様のことを起こさないように努力します、ごめんなさい」をするのだ。どのように再発防止の努力するのかを書くものでもある。主にクライアント向けのビジネス内容ではあるが、自分が使っているテンプレパターンを共有するので参考にしてもらえればと思う。1 全般的なポイント心得のようなもの。次の点は留意してて欲しい。淡々と冷静な説明をこころがける当然のことながら事実は脚色しない。無駄な修飾も要らない。客観的な事実を簡潔に述べる。例： ❌「一生懸命頑張って対応したが…」 ❌「寝ないで対応したが…」 ❌「本当の原因は…」できるだ
- ドキュメント
- あとで読む
- 障害
- 運用
- 仕事
- qiita
- 技術
- 資料
- IT
- マネジメント
【2024年6月版】管理画面のUIデザインにおける25の改善ポイント | ベイジのUIラボ～業務システムとSaaSのUIを考える
- 807 users
- baigie.me
- テクノロジー
- 2020/06/16
私たちの日常業務で使われる管理画面は、大量の情報と複雑な機能で構成され、利用難度が高い傾向にあります。検索性の乏しい管理画面の一覧から1つの情報を見つけるために、どれだけの時間を費やしているでしょうか。 1億円の工数をかけて開発した機能も、低品質なデザインでは、機能の存在に気付かれなかったり、間違って使われたりと、期待した業務コストの削減に繋がりません。これでは、1億円を捨てたようなものです。使い勝手の良くないデザインは、ユーザーだけではなく、開発者にも悪影響を及ぼします。複雑な構造と分かりにくい操作体系の管理画面は、開発やテストの手間を増やし、その後の機能拡張も難しく、改修コストも増大します。これらのリスクを抑えるためには、UIデザインの基本原則を理解し、適切に管理画面を設計することが重要です。私たちは管理画面のUIデザインの改善やリニューアルを手掛けることも多いのですが、その経験
- ui
- デザイン
- あとで読む
- 管理画面
- design
- システム
- Admin
- 管理
- web
- webデザイン

数時間かかる週一リリースを毎日何度も爆速でできるようにするまで / CI/CD Conference 2021
- 514 users
- speakerdeck.com/k0kubun
- テクノロジー
- 2021/09/03
CI/CD Conference 2021
- ci
- あとで読む
- devops
- デプロイ
- 開発
- terraform
- development
- CD
- サーバ
- サービス
もし今1からKubernetesを勉強するとしたらどうやって勉強するか - 腹は減る
- 512 users
- blux.hatenablog.com
- テクノロジー
- 2020/07/31
Kubernetesを触り始めて約1年。 1年の間にたくさんKubernetes関連の日本語書籍が出たし、1年の間に「え、これ先知っておきたかったわ」ということがありました。ということで今1から勉強するとしたらどうするかな〜と考えたのでまとめてみます。あくまで私ならどうするか、ていう話なので人によっては再現が難しい可能性があるのであしからず！！（英語がある程度できる前提で書いてるところもあります）条件ドキュメントをいきなり読むのは日本語だろうと結構苦手なるべく手を動かしたい最初はアプリケーションエンジニアとしてKubernetesを触れるくらいのレベル感をめざす Dockerはなんとなくわかる分散システムにあまりなじみがない本当はできれば最初からドキュメントをしっかり読み通すのが一番いいと思っている！思っているよ... 1st step 動画を見る UdemyのCKAのコー
- kubernetes
- あとで読む
- k8s
- 勉強
- docker
- 本
- infra
- code
- programming
Postgres と MySQL における id, created_at, updated_at に関するベストプラクティス
- 499 users
- zenn.dev/mpyw
- テクノロジー
- 2022/06/16
読者対象ある程度データベースに関する知識を持っている，経験年数 1 年以上のバックエンドエンジニア特定のプログラミング言語に依存する部分は含めないため，すべての SQL 使用者を対象とするまた，ゼロからの丁寧な説明というよりは，リファレンス感覚で使える記事という形にまとめる。 RDBMS の対象バージョン PostgreSQL: 9.4 以降 MySQL: 8.0.28 以降 id （データ型と INSERT 時のデフォルト埋め）導入一般的に採用されやすいプライマリキー用の値として，以下を考える。連番整数 MySQL では AUTO_INCREMENT， Postgres では IDENTITY や SERIAL と呼ばれるもの UUID v1: ハードウェアごとにユニークな単調増加値 UUID v4: ランダム値 UUID v7（ドラフト）: 単調増加であるタイムスタンプとラ
- postgresql
- mysql
- db
- あとで読む
- SQL
- database
- データベース
- UUID
- 設計
- id
あんどぅ on Twitter: "本番運用するといずれ誰もがたどり着く、公式ドキュメントには書かれてないログ管理の現実解が資料化されていてすばらしいそう、CloudWatch LogsにはDev環境 or ERRORの場合のみ飛ばすFluentdの設定をすることで利便性と料金のバランスをとるのであるこれは公式ドキュメントにすべき https://t.co/RE4FmPCpJX"
- 492 users
- twitter.com/integrated1453
- テクノロジー
- 2022/11/10
- aws
- あとで読む
- ログ
- 運用
- fluentd
- ドキュメント
- 環境
- インフラ
- サーバ
- monitoring
MySQL のレプリケーションから10年間逃げてきた我々が学んだこと8選 - Cybozu Inside Out | サイボウズエンジニアのブログ
- 473 users
- blog.cybozu.io
- テクノロジー
- 2020/10/26
こんにちは。クラウド運用チームで SRE をしている飯塚です。今回は、MySQL のレプリケーション機能を約10年もの間ずっと使ってこなかった私たちが、レプリケーションを使った高可用性構成に移行するための取り組みの中で学んだことについて紹介します。背景巨大なテーブルへの primary key の付与トランザクションサイズが大きい場合には tmpdir に注意 mysqldump で絵文字が消えていないか要チェック mysqldump が Error 1412: Table definition has changed... で失敗する mysqldump したデータのリストアが Duplicate entry 'xxx-yyy-PRIMARY-n_diff_pfx01' for key 'PRIMARY' で失敗することがある mysqldump したデータのリストア時のディスク
- mysql
- あとで読む
- DB
- レプリケーション
- cybozu
- innodb
- データベース
- database
- 設定
- replication
アプリケーション開発者は Amazon ECS あるいは Kubernetes をどこまで知るべきか #AWSDevDay / You build it, you run it
- 414 users
- speakerdeck.com/toricls
- テクノロジー
- 2021/09/29
Talked at AWS Dev Day Online Japan 2021. - 動画: https://youtu.be/I7mMQshlpcs - イベントページ: https://aws.amazon.com/jp/about-aws/events/2021/devday - Pro…
- kubernetes
- aws
- ecs
- あとで読む
- コンテナ
- k8s
- 開発
- devops
- 運用
- docker
SELECT文で本番環境を落としたお話 - Qiita
- 411 users
- qiita.com/YujiSoftware
- テクノロジー
- 2019/12/26
（この記事は地平線に行くとのマルチポストです）本番環境でやらかしちゃった人 Advent Calendarで、このパターンのやらかしはなかったのでキーボードを叩くことにしました。番外編のつもりでお楽しみください。この記事が、新たな障害発生を防ぐことにつながれば幸いです。何をやったのかある日、ちょっとした調査のために本番データベースのデータを確認することになりました。（個人情報が格納されているようなシステムではなかったので、必要であれば本番データベースへのアクセスが許されていました）もしメンテナンスがあればそのタイミングでやればよかったのですが、直近では特に予定はないとのことでした。そのため、システムが動いている状態のまま作業をすることにしました。ごく単純な SELECT を実行するだけのつもりだったので、システムに影響がないと判断したためです。その際、万が一コピペをミ
- SQL
- あとで読む
- データベース
- Qiita
- PostgreSQL
- DB
- MySQL
- トランザクション
- 障害
- システム
コンテナ運用におけるログ基盤設計のベストプラクティス - Qiita
- 406 users
- qiita.com/naomichi-y
- テクノロジー
- 2020/12/24
課題数年前と比較すると、GKEやECSを始めとするコンテナ実行環境でのアプリケーション運用を行うサービスはかなり増えてきた印象があります。コンテナを運用する上では、アプリケーションのイベントを追跡する上でログをどう扱うかが課題になります。今までのように古いログを定期的にローテートして別のストレージに転送するといった手法はクラウドネイティブなアーキテクチャには最適とは言えません。アプリケーション開発の方法論として、Twelve Factor App ではログをイベントストリームとして扱うためのガイドラインが示されていますが、近年のWebアプリケーションではシステムを疎結合に連携するマイクロサービスという考え方が主流になりつつあります。アプリケーションログはサービスごとにフォーマットを整形した上で、ログ収集サービスに配送。必要に応じてリアルタイム分析や異常データの通知、そしてデータの可
- コンテナ
- あとで読む
- ログ
- 運用
- 設計
- docker
- ecs
- qiita
- kubernetes
- aws
「コード書きました、あとはよろしく」では優れたソフトウェアは生まれない　コンテナのスペシャリストが語る、運用性を損なう8つの実装例
- 374 users
- logmi.jp
- テクノロジー
- 2022/02/03
今押さえておくべき知識をアップデートし、ノウハウを共有し、さらなるスキルアップを実現する場として開催されている、AWS で最も Developer に特化したカンファレンス「AWS Dev Day Online Japan」。ここでSr. Product Developer Advocate, Elastic Containersの原氏が登壇。続いて、運用性に優れたソフトウェアが重要な理由と、運用性を損なう8つの実装例について紹介します。前回はこちらから。 You build it, you run it 原トリ氏：（スライドの「You build it, you run it」を指して）この言葉、聞いたこと、見たことがある方がいるかもしれません。これは、2006年にACM（Association for Computing Machinery）という団体が、Amazon AWSのCTOで
- 開発
- あとで読む
- 運用
- コンテナ
- aws
- ソフトウェア
- devops
- docker
- コード
- 仕事
「運用組織」の考え方と設計〜運用組織論 2021 / 20210310-ssmjp-operation-organization
- 372 users
- speakerdeck.com/opelab
- テクノロジー
- 2021/03/11
ssmjp ssmonline #8 "第三回はたのさん祭オンライン"( https://ssmjp.connpass.com/event/206074/ )での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- 設計
- 組織
- あとで読む
- 考え方
- devops
- management
- ssmjp
- マネジメント
- 仕事
Cloudflare outage on June 21, 2022
- 364 users
- blog.cloudflare.com
- テクノロジー
- 2022/06/21
IntroductionToday, June 21, 2022, Cloudflare suffered an outage that affected traffic in 19 of our data centers. Unfortunately, these 19 locations handle a significant proportion of our global traffic. This outage was caused by a change that was part of a long-running project to increase resilience in our busiest locations. A change to the network configuration in those locations caused an outage
- cloudflare
- CDN
- あとで読む
- 障害
- network
- incident
- ネットワーク
- BGP
- トラブル
- セキュリティ
大規模オンプレミスなヤフーのサーバーインフラの裏側〜サーバー調達や運用の流れを紹介します
- 333 users
- techblog.yahoo.co.jp
- テクノロジー
- 2019/12/17
OEM系→ODM系にシフトした背景ですが、1つは価格競争力です。インフラにおいてプライスは重要な指標です。また昔と今でヤフーのサーバーの買い方に違いがある事もポイントになっています。昔のヤフーは、いろいろな部門が、いろいろな構成のサーバーを、いろいろなタイミングで購入していました。この結果、納期面で有利なOEMを第一選択肢としていました。またいろいろな構成のサーバーが入る事を考慮した結果、自営保守ではカバーしきれない範囲も多く、ベンダーが提供するサポートに依存している部分もありました。しかし最近では自社クラウド環境の普及により、決まった部門決まった構成決まったタイミングで購入するようにになってきたため、納期に関して余裕を持ったスケジューリングができるようになりました。またクラウド環境で利用できるサーバーはかなりハイスペックなため、価格の数％の違いも大きなビジネスイン
- インフラ
- あとで読む
- サーバ
- yahoo
- 運用
- server
- infrastructure
- hardware
- ヤフー
- Yahoo!
入門入門監視 / reading-practical-monitoring
- 300 users
- speakerdeck.com/o0h
- テクノロジー
- 2021/02/21
「入門監視」を読んだので、自分たちのチームに当てはめて考えてみる
- 監視
- あとで読む
- 運用
- monitoring
- slide
- book
- 入門
- dev
Kubernetesの自前運用は難しい？　はてなの撤退事例
- 286 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2019/11/08
はてなのMackerelチームはKubernetesクラスタを自前で構築して運用していたが、撤退を選択したという。なぜ、Kubernetesの運用を諦めて撤退を選んだのか。はてなのMackerelチームでSREを務める今井隼人氏が語った。コンテナ型仮想化技術を活用したアプリケーションの管理（オーケストレーション）ツール「Kubernetes」が注目を集めている。その背景の一端にあるのが、アプリケーションをコンテナ化し、マネージドKubernetesサービスで実行することによるメリットの享受と、運用負荷の軽減だ。参考記事：「Kubernetes」とは何か――コンテナ型仮想化の本番利用に向けた課題参考記事：「Kubernetesで運用する」その前に　Kubernetesを本番環境で利用する際のポイントそんな中、「Kubernetesクラスタを自前で構築して運用していたが、撤退を選択した
- kubernetes
- k8s
- あとで読む
- 運用
- はてな
- 事例
SRE実践の手引 ─ 信頼性をどう制御するか？から始める、現実的な指標と目標の設計と計測 - エンジニアHub｜Webエンジニアのキャリアを考える！
- 274 users
- eh-career.com
- テクノロジー
- 2019/12/05
SRE実践の手引 ─ 信頼性をどう制御するか？から始める、現実的な指標と目標の設計と計測 SREの役割には、信頼性、SLIとSLO、エラーバジェット、トイル、ソフトウェアエンジニアリングといった複数のキーワードが存在するがゆえ、なかなかうまく実践できない、という声もあります。本稿では、難しく見られがちなSREの内実を、「信頼性の制御」というコンセプトを軸に整理し、小さく始める一歩を坪内佑樹（ゆううき）さんが解説します。こんにちは。SREの研究者をやっているゆううき（@yuuk1t）です。 SRE（Site Reliability Engineering）は、従来のオペレーションエンジニア、システム管理者（sysadmin）と呼ばれる人々が担っていた技術領域の新しい形です。Googleによって提唱され、日本国内でも2015年ごろからWebコンテンツ事業者のコミュニティを中心に広く知られる
サーバ作業を安全に行うための工夫
- 271 users
- heartbeats.jp
- テクノロジー
- 2022/09/27
こんにちは。 2021年7月にハートビーツに入社後、エンジニアリンググループに所属している北岡です。以前は同じMSP企業で10年以上勤務しておりましたが、自身のスキル向上などを目的としてハートビーツへ入社しました。私の転職の経緯やハートビーツへ入社して感じたことなどは今後お話するとして、今回はお客様のLinuxサーバ上で作業する際、私がオペレーション中に意識していることやミスを防ぐために行っていることについて紹介します。コピー、ペーストのショートカットキーを変更するコピー「Ctrl + c」とペースト「Ctrl + v」はキーが隣り合っており、タイピングミスによってコピーしようとしたつもりがペーストしてしまったということが起こりえます。メモ帳などで起きた場合は特に問題にはなりませんが、サーバ上で起きると不要なコマンド実行に繋がります。小さなことではありますが防止策をとるべきです。
- サーバ
- あとで読む
- コマンド
- 運用
- linux
- tmux
レガシーとの向き合い方　〜cron から Rundeck へ〜 - DMM inside
- 264 users
- inside.dmm.com
- テクノロジー
- 2020/08/11
｜DMM inside
- cron
- 運用
- rundeck
- あとで読む
- slack
- サーバ
- システム
- server
- バッチ
- Linux
ローカルマシンでDocker を動かさないためにBlimp を採用する - y-ohgi's blog
- 263 users
- y-ohgi.blog
- テクノロジー
- 2020/12/15
https://blimpup.io TL;DR docker-compose をリモートで実行するための開発フェーズ向けのサービスローカルマシンへ負荷をかけずに開発できる URL を発行してくれるため第三者への公開も可能概要 blimpup はざっくりいうと「docker-compose をリモートで実行する」ためのサービスです。用途としては本番環境としてではなく開発フェーズでの利用を想定されており、docker-compose を使用した開発の効率化を行ってくれます（k8s のtelepresence に近いイメージです）。従来開発フェーズで使用していたdocker-compose をローカルで直接コンテナを動かすのではなく、blimp の提供するインフラ上で動かし、ローカルマシンに負荷をかけることなく開発が可能になります。ローカルのファイルと同期を行ってくれるためファイルの更
- docker
- 開発
- あとで読む
- コンテナ
- サービス
- docker-compose
- コマンド
- development
- dev
- 仮想化
運用設計における設計項目の体系化 / 20240207-ssmjp-operation-design-items
- 258 users
- speakerdeck.com/opelab
- テクノロジー
- 2024/02/08
ssmjp ssmonline #38 "第四回はたのさん祭オンライン"( https://ssmjp.connpass.com/event/307397/ )での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- あとで読む
- 設計
- 開発
- 資料
- システム
AWSのCLI作業はどこで行う？安全に管理するパターンとメリデメ集 | DevelopersIO
- 233 users
- dev.classmethod.jp
- テクノロジー
- 2021/05/28
AWSアクセスキーセキュリティ意識向上委員会って何？昨今、AWSのアクセスキーを漏洩させてしまうことが原因でアカウントへの侵入を受け、多額の利用費発生・情報漏洩疑いなど重大なセキュリティ事案が発生するケースが実際に多々起きています。そこで、アクセスキー運用に関する安全向上の取組みをブログでご紹介する企画をはじめました。アクセスキーを利用する場合は利用する上でのリスクを正しく理解し、セキュリティ対策を事前に適用した上で適切にご利用ください。 AWS CLI、どこから使っていますか？ざっくり、以下4種類のどれかを使っている方が多数派ではないでしょうか。ローカル端末 AWS内に構築した管理用EC2にSSHを利用して接続 AWS内に構築した管理用EC2にSSM(セッションマネージャ)を利用して接続 AWS CloudShell 一体どう違うのでしょうか。状況によって良し悪しは異なる
- aws
- あとで読む
- CLI
- iam
- セキュリティ
- 運用
- security
- 管理
- Amazon
latestタグのままdocker imageを本番運用してどうなったか - 京都行きたい
- 228 users
- progret.hatenadiary.com
- テクノロジー
- 2020/01/23
latestタグや書き換えるためのタグ（develop, stagingなど）を使って、本番で運用するのはやめましょう。コンテナイメージのキャッシュ状況やリリースフローによっては予期しない形で予期しないバージョンが本番で起動する可能性があります。本記事では、どのプラットフォームやツールで発生したかについては記載しません。本題はそこではないのと、そもそも運用が間違っているので記述しても余計な枝葉になるからです。この記事ではどういうことが起きたか、について書きます。どういうことが起きたかサービスで、dockerイメージのlatestタグを使って本番運用していた。全コンテナをgraceful restartしたようだ。（つもりだったが・・・）別の作業中、管理画面の表示がおかしくなっているという話が出てきた。そこで調べてもらったところ、なぜかリリースしたはずの機能が正常に機能
個人でもAWS Organizationsを使ったほうが良い理由 - 本日も乙
- 227 users
- blog.jicoman.info
- テクノロジー
- 2021/07/23
技術書典11で「Amazon Web Servicesコスト最適化入門マルチアカウント編」を頒布中です。 techbookfest.org BOOTHでも購入できますが、送料（370円）がかかってしまうので、7/25までであれば技術書典のオンラインマーケットだと送料がかからずお得かと思います。オンラインマーケットだと物理本の発送が8月になってしまいますが、BOOTHは私が発送するので注文後数日で届きます。すぐに物理本が欲しい人はBOOTHまで。 booth.pm マルチアカウントに対する障壁の高さ個人用途におけるマルチアカウントのメリット使い捨てのAWSアカウントを作ることができる検証用環境として活用する GCPのプロジェクトと同じような感覚マルチアカウントのデメリットアカウントの削除（解約）が面倒セキュリティコスト管理まとめマルチアカウントに対する障壁の高さ 6/19
Pythonでコードを書いてAWSやKubernetesのシステム構成図を出力できる「Diagrams」
- 226 users
- gigazine.net
- テクノロジー
- 2020/05/18
システムの構成を社内で共有したり外部に説明したりする際に、システム構成図を作成した経験のあるエンジニアは多いはず。ダイアグラム作成ソフト「Diagrams」を使うと、AnsibleやSubiquityといった「Infrastructure as Code(IaC)」に関連するサービスのように、プログラミング言語のPythonでコードを書くことで、クラウドやオンプレミスの構成図を描くことができます。 Diagrams · Diagram as Code https://diagrams.mingrammer.com/ まずはDiagramsの動作に必要なパッケージをインストールします。今回Diagramsのインストールに利用するのはUbuntu 18.04です。 sudo apt install -y python3 python3-pip graphviz 続いてDiagramsをインスト
- python
- diagrams
- あとで読む
- 作図
- aws
- kubernetes
- コンテナ技術
- gigazine
- アーキテクチャ
- Docker
最強のツール「LangSmith」が登場した話【Python / LangChain】
- 220 users
- zenn.dev/umi_mori
- テクノロジー
- 2023/07/23
【📩 仕事の相談はこちら 📩】お仕事の相談のある方は、下記のフォームよりお気軽にご相談ください。 https://forms.gle/G5g1SJ7BBZw7oXYA7 もしもメールでの問い合わせの方がよろしければ、下記のメールアドレスへご連絡ください。 info*galirage.com（*を@に変えてご送付ください） 🎁 「生成AIの社内ガイドライン」PDFを『公式LINE』で配布中 🎁 「LINEで相談したい方」や「お問い合わせを検討中の方」は、公式LINEでご連絡いただけますと幸いです。（期間限定で配信中なため、ご興味ある方は、今のうちに受け取りいただけたらと思います^^） https://lin.ee/3zRuqKe おまけ①：生成AIアカデミーより専門的な「生成AIエンジニア人材」を目指しませんか？そんな方々に向けて、「生成AIアカデミー（旧：生成AIエンジニア
- LLM
- LangChain
- あとで読む
- ChatGPT
- python
- AI
- 機械学習
- データ
Fastlyが大規模障害の経緯を公開、原因はソフトウェアのバグ。障害を1分以内に検知し、49分でおおむね復旧させたと報告
- 208 users
- www.publickey1.jp
- テクノロジー
- 2021/06/09
Fastlyが大規模障害の経緯を公開、原因はソフトウェアのバグ。障害を1分以内に検知し、49分でおおむね復旧させたと報告 CDNベンダ大手のFastlyが日本時間6月8日夕方に障害を発生、その影響は国内にもおよび、メルカリや楽天市場、Amazon.co.jp、Twitter、ABEMAなど多くのサービスに接続できないなどの障害が発生しました。 We identified a service configuration that triggered disruptions across our POPs globally and have disabled that configuration. Our global network is coming back online. Continued status is available at https://t.co/RIQWX0LWwl
リクルートのAWS基盤におけるTerraform運用_実践的な取り組みと組織づくり / HashiCorpVirtualStrategyDay_sudo
- 203 users
- speakerdeck.com/recruitengineers
- テクノロジー
- 2022/04/23
2022/04/21_HashiCorp Virtual Strategy Day Japan Vol.2での、須藤の講演資料になります
生産性を可視化したい！ / SUZURI's four keys
- 170 users
- speakerdeck.com/udzura
- テクノロジー
- 2021/06/17
@Pepabo Tech Conference #15 - ECプラットフォームSUZURIの開発の裏側 https://pepabo.connpass.com/event/215058/
Terraformerとしてコードを書いて思うこと | フューチャー技術ブログ
- 165 users
- future-architect.github.io
- テクノロジー
- 2021/10/29
こんにちは。TIGの伊藤です。この記事は秋のブログ週間2021の3日目です。はじめに私は普段会社でクラウドをまたいでTerraformを日々書いたり、メンバーに教えたりしています。もはや俗に言うプログラミング言語を書かずにここまで全振りしてきたくらいなので、比較的自信を持ってコードを書いて仕事をしています。特にここ最近はほぼ1からコード設計をして運用まで持っていくこともあり、「より腐りにくい、より息の長いコード」というものを考えるようになりました。Terraformだからこその「定期メンテを簡易にするためには」「より簡単に変更するためには」をひたすら突き詰めていった結果、アツい気持ちが生まれ、今回は筆を取っています。そんな私のアツい気持ちをしたためた今回の記事ですが、可能な限り例も添えつつ、いくつか解説できればと思います。公式にも実は載っているような内容もあったりしますが、日本語の記
- Terraform
- IaC
- あとで読む
- aws
- コード
- 運用
- 技術
- ブログ
- web
Amazon RDS/Auroraをクローンするシステムを作った話 - クックパッド開発者ブログ
- 163 users
- techlife.cookpad.com
- テクノロジー
- 2020/08/20
こんにちは、技術部SRグループの菅原です。最近、Ninja650からNinja1000に乗り換えました。パワーがあるせいで３速発進・４速発進が平気でできてしまい、シフトワークがどんどん下手になっています。精進したいものです。この記事では、Amazon RDS/Auroraをクローンするシステムを作った話を書きます。 Amazon RDS/Auroraをクローンするシステムサービス開発を行っていると、調査や検証でプロダクション環境で使われているデータベースが必要になることがあります。開発環境やステージング環境にもデータベースは存在するのですが、プロダクション環境のデータでしか再現しないバグの調査や、プロダクション環境のデータ量でのスキーマ変更の負荷の検証など、開発環境やステージング環境のデータベースではできない作業も多いです。しかし、オペレーションミスや個人情報へのアクセスを考えると、
- aws
- db
- RDS
- あとで読む
- aurora
- amazon
- database
- データベース
- 開発
- SQL
WebAssemblyでの機械学習モデルデプロイの動向
- 142 users
- www.tkat0.dev
- テクノロジー
- 2020/12/02
本記事はMLOps Advent Calendar 2020の 2 日目の記事です。 WebAssembly（Wasm）は機械学習モデルをデプロイする新たな手段になりうるでしょうか。この記事では、機械学習モデル（特に Deep Learning）を Wasm でデプロイする周辺技術の動向や内部の仕組みをざっくりと説明します。 Table of Contents tkat0 です。WebAssembly(Wasm)面白いですね。私も最近はyewでフロントエンドを書いて遊んでいます。Rust で React っぽいことできるのは新鮮で面白いです。 Wasm は、なんとなく速い JavaScript？とか機械学習で何に役立つの？とか思ってる方も多いと思います。しかし、Wasm はブラウザでの推論時に使えるだけでなく、機械学習モデルのサービングやエッジデバイスでの推論にも使えると知ったら驚き
- WebAssembly
- 機械学習
- wasm
- あとで読む
- machinelearning
- TensorFlow
- MLOps
- continuousDelivery
- deploy
- tvm
運用技術者組織の設計と運用 / Design and operation of operational engineer organization
- 138 users
- speakerdeck.com/nari_ex
- テクノロジー
- 2019/12/12
第12回インターネットと運用技術シンポジウム（IOTS 2019）～運用管理する人”も”報われるシステムの構築を考える～にて招待講演を行った際の資料です。概要: https://www.iot.ipsj.or.jp/symposium/iots2019/ プログラム: https://ww…
- 運用
- 設計
- あとで読む
- 組織
- 技術
エラー監視とテスト体制への改善作戦 / PHPerKaigi2022
- 131 users
- speakerdeck.com/kazatohiei
- テクノロジー
- 2022/04/09
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
- テスト
- あとで読む
- 監視
- エンジニア
- 考察
- php
監視論～SREと次世代MSP～
- 123 users
- speakerdeck.com/qryuu
- テクノロジー
- 2020/09/13
ITシステム監視を何故行うのかなぜ監視からオブザーバビリティーが求められるのか次世代MSP、今後の監視エンジニアに求められる能力とは
- SRE
- あとで読む
- 監視
- Technology
Summary of June 8 outage
- 122 users
- www.fastly.com
- テクノロジー
- 2021/06/09
Summary of June 8 outageWe experienced a global outage due to an undiscovered software bug that surfaced on June 8 when it was triggered by a valid customer configuration change. We detected the disruption within one minute, then identified and isolated the cause, and disabled the configuration. Within 49 minutes, 95% of our network was operating as normal. This outage was broad and severe, and we
- fastly
- incident
- 障害
- あとで読む
- cloud
- trouble
- network
SRE の原則に沿ったトイルの洗い出しとトラッキング | Google Cloud 公式ブログ
- 115 users
- cloud.google.com
- テクノロジー
- 2020/02/21
※この投稿は米国時間 2020 年 2 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。作業効率を検証するために Google のサイト信頼性エンジニア（SRE）が使用している主な測定指標の一つが、日々の時間の使い方です。長期間のエンジニアリングプロジェクトのために時間を確保する必要がありますが、エンジニアには Google のサービスを稼働し続ける責任もあり、そこにも手作業が生じることがあります。Google の SRE は、いわゆる「トイル」に費やされる時間を勤務時間の 50% 未満にすることを目指しています。では、トイルとは何でしょうか。トイルに邪魔されずに開発スピードを維持するには何をすべきでしょうか。本稿ではこれらの問いについて見ていきます。まずトイルの定義ですが、『Site Reliability Engineering』の第 5 章には次の
- SRE
- あとで読む
- google
- cloud
- WEBサービス
- blog
DevOpsトポロジー
- 98 users
- www.ryuzee.com
- テクノロジー
- 2022/04/11
みなさんこんにちは。@ryuzeeです。 2021年12月1日に発売した『チームトポロジー価値あるソフトウェアをすばやく届ける適応型組織設計』ですが、おかげさまで多くの方に読んでいただき感謝しています。チームトポロジー価値あるソフトウェアをすばやく届ける適応型組織設計著者／訳者：マシュー・スケルトン、マニュエル・パイス、原田騎郎、永瀬美穂、吉羽龍太郎出版社：日本能率協会マネジメントセンター発売日：2021-12-01単行本：280ページISBN-13：9784820729631ASIN：4820729632 今日はこの「チームトポロジー」の元となったDevOpsトポロジーについて紹介します。このアイデアは2013年に著者の1人であるマシュー・スケルトンが自身のブログに書いた記事をまとめたものです。 2013年頃といえばDevOpsが流行しはじめた時期だと思いますが、こ
- devops
- あとで読む
- SRE
- チーム
- 組織
- 開発
- Blog