Operationの人気記事 121件 - はてなブックマーク

1 - 40 件 / 121件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Operationの検索結果1 - 40 件 / 121件

Operationに関するエントリは121件あります。運用、開発、仕事などが関連タグです。人気エントリには『知っておきたかったLinuxサーバ設計、構築、運用知識まとめ - hiroportation』などがあります。

知っておきたかったLinuxサーバ設計、構築、運用知識まとめ - hiroportation
- 1445 users
- thelarklife1021.hatenablog.com
- テクノロジー
- 2021/05/08
サーバ業務周りの管理、運用について役に立ちそうなナレッジをまとめました。長期的に書いているため用語に統一性がなかったり、不足分など随時修正したいと思います。 1. サーバ設計サーバスペックはどうするべき？使用するOSは？ CentOS開発終了について MWは何を使うべきか Webサーバ構築にはどちらを使うべき？Apache？Nginx？サーバセキュリティで最低限押さえておきたいことは？ listenするポートは最小限にしましょうファイアウォール設定で送受信IPアドレス、ポートの通信制御はしておきましょう外部に出る際にはプロキシサーバを経由するようにする随時パッチを当てるようにする linuxでのアンチウイルスソフトの検討個人アカウントで変更系コマンドは実行させないようにするログについて考えることストレージ容量には気をつけるデータベースはどう決めたら良いか MySQLか
- linux
- あとで読む
- サーバ
- 設計
- 運用
- server
- 設定
- 開発
- コマンド
- centos
AWS システム構築非機能要件ヒアリングシートを公開してみた | DevelopersIO
- 1151 users
- dev.classmethod.jp
- テクノロジー
- 2020/07/27
こんにちは。ご機嫌いかがでしょうか。 "No human labor is no human error" が大好きなネクストモード株式会社の吉井亮です。日本国内においても多くのシステムがクラウド上で稼働していることと思います。俊敏性、拡張性、従量課金、IaS、セキュリティなどクラウドのメリットを享受しやすい所謂 SoE で多くの実績があるように感じます。ここ1~2年は、社内基幹システム・情報システム、SoR 系のシステムのクラウド移行が本格化してきたというのが肌感覚であります。クラウドでのシステムインフラ構築は従来のようにゼロから非機能要件定義を行っていくものではなく、ベストプラクティスをまず実装して少しずつ微調整を行っていくものと考えています。とはいえ、システムごとの要件は予め明らかにしておくことがインフラ構築においても重要になります。クラウド上では出来ること出来ないこと
バッチ処理プラクティス
- 1062 users
- www.yamarkz.com
- テクノロジー
- 2021/12/15
バッチ処理は既に先人の方々が多くのナレッジを公開してくれていますが、それでもなお難しさが変わらないテーマだと思っています。この記事は、筆者がこれまでの開発経験で気づいたバッチ処理の実装ナレッジを整理し、体系化を目指して文章にしました。ここでの内容が、より良い課題解決に貢献できれば幸いです。自身の断片的な思考整理(メモ書き)の延長で内容を整理したため、一部書き振りが統一されておらず、読みにくいかもしれません。ご了承ください。🙏 バッチ処理の難しさバッチ処理は難しい。人によっては簡単なテーマかもしれませんが、自分は難しいテーマだと思っています。「難しさの根源は何か？」を考えると、1. 考慮点が多様にあること 2. 解決する課題によって答えが大きく変わることに整理できました。この2点は、どのソフトウェア開発にも当てはまる項目ではありますが、ことバッチ処理においては顕著に現れます。
みずほ銀行システム障害に学ぶ
- 999 users
- ja.kohsuke.org
- テクノロジー
- 2021/06/17
みずほ銀行システム障害の調査報告書が公開されたのがニュースになって、Twitterなどで色々な人がコメントをしているのを見た。140文字しか書けない空間で他人の失敗談の揚げ足取りをするのは簡単だが、そこからは一時の爽快感以外に何も得るものがないので、僕はそういうのはカッコ悪いと思っている。そこで、ちゃんと読んでみたら全く他人事でない部分も沢山あるし、非常に面白く勉強になったので、ブログにまとめてみる。技術的な話銀行のシステムがどのようになっているのか、全然イメージが湧いていなかったので、それがまず勉強になった(p.29)。トラフィックのソースに応じて用意された色々なシステムから基幹システム「MINORI」の取引メインバスにトラフィックが流れ、そこから各種システムへとリクエストが送られていく。この辺はService Oriented Architectureらしい。開発当時としては（
- 障害
- あとで読む
- システム
- 開発
- IT
- development
- 運用
- 銀行
- セキュリティ
- 仕事

「次から気をつけます」に対抗する、反省文よりは効果が上がる再発防止、学びの機会 - Qiita
- 966 users
- qiita.com/e99h2121
- テクノロジー
- 2021/08/16
再発防止策を書くのは難しい。良い再発防止策良い再発防止策について、順位付けするとしたら、その種類の問題について二度と意識することがなくなる解決策その種類の問題を開発時に自動的に検知することができる解決策その種類の問題が発生しても自動的に復旧することができる解決策その種類の問題が発生しても影響が局所化される、フールプルーフ、フェールセーフになる解決策と言うのは意識したいと思いつつ、やはり難しい。再発防止はむずかしい障害の再発防止策は、メカニズムツールルールチェックリストの順番に検討せよ。と言われても、急いで書けなんて言われると「次回からは複数人でチェックします。」とか「チェック項目を追加します。」とかいう徹底できなそうな「反省文」になってしまう。まさにこの有名な猫...。 **「なぜミスを繰り返すのか」「どうすればミスを防げるのか」を真剣に考えていないことがミス
Kubernetes、やめました | 外道父の匠
- 810 users
- blog.father.gedow.net
- テクノロジー
- 2020/06/03
最近 Kubernetes 全然触ってねーなって思ってたところに、『6年ぶりぐらいにクラウド使った結果、Kubernetes以外のマネージドサービスとか基本要らなくない？となった話 – データエンジニアの酩酊日記』を見つけて、自分と異なる立場によるコンテナシステムへの感想を興味深く読ませていただきました。 Kubernetes を推す人がいる一方で、ここには昨夏『Kubernetes、はじめました』と言っておきながら今年に入って全然触らず、ECSを使ったシステムばっか手掛け、Kubernetes いらなくね？って思う人もいるわけで。これはいったいどういうことでしょう、と雑感タイムです。どうしてコンテナシステムで迷うのか最初に断っておきたいのは、以下 Kubernetes を否定したり腐すような意図は全くなく、なんでやろ？って自身に問いかけた私見です。やめました、と言ってもウチで今も使っ
- kubernetes
- あとで読む
- インフラ
- k8s
- aws
- ecs
- terraform
- コンテナ
- 運用
- Docker
なぜ西松屋はいつもガラガラなのに潰れないのか…赤ちゃん本舗とは全然違う｢売らなくていい｣驚愕の店づくり縮小市場で生き残るための唯一の必勝法
- 630 users
- president.jp
- 政治と経済
- 2024/05/15
子ども・ベビー用品を扱う西松屋が成長を続けている。少子化なのになぜ儲かるのか。流通アナリストの中井彰人さんは「西松屋は驚くほど『売らなくていい』店の作り方をしている。これこそが西松屋が見出した縮小市場で生き残り、成長していくための必勝法なのだ」という――。人口減少のなかでも店舗を増やすチェーンストア 2023年は、最後まで人口が増加していた沖縄県が減少に転じたことで、全都道府県で人口減少となった、という節目であったらしい。我が国の人口は、2009年に既にマイナスに転じていたのだが、地域によってその進行スピードが異なっており、これで全国共通の事象となった。地方ではかなり早くから減少していた地域があり、減少県の数でみると、1981年だと0県だったのが、1991年15県、2001年27県、2011年39県というペースで増えてきた。こうした環境下でも、チェーンストアは店舗を増やして成長するとい
- 経営
- ビジネス
- あとで読む
- マーケティング
- 企業
- business
- 人口
- 育児
- 流通
- システム
「仕事のコード」を残す際のチェックリスト｜Uchio Kondo
- 541 users
- note.com/udzura
- テクノロジー
- 2021/08/10
最初に注意: この文章は「はじめに」「総論」が長いです🙃 追記＠2021/08/11 17:46想像よりはるかに反響をいただいたので、せっかくだからと要点をMarkdownにしてGitHubに置いてみました。何かにご利用ください。はじめに・「仕事のコード」、つまり、業務などで作ったコードが、なるべく負債にならず、なるべく俗人化しないようにするために留意すると良さそうなことを自分の経験などから列挙したものです。・ちなみに、「対象読者」に書いてありますが、そもそものモチベーションが「非エンジニアがノーコード系のサービスで作ったシステムが最近増えつつあるような...」というところでした。こういうのどう取り扱うといいんですかねとなった時、まずは運用できる形にしてもらいたい、という狙いがあります。結果的に、ジュニアなエンジニアが良いシステムを残す上でも使える知識かなと思います。・個別の項目に
ソフトウェアはなぜバージョンアップしなければならないのか - Qiita
- 534 users
- qiita.com/autotaker1984
- テクノロジー
- 2023/07/29
はじめに社内インフラの運用担当者にとってソフトウェアのバージョンアップは地味な割に大変な業務です。特に社内のオンプレサーバで動いているようなソフトウェアの場合、バージョンアップに伴う諸々の調整をそのソフトウェアを利用している各部署と行う必要があります。そんなときに「今は忙しいからバージョンアップを先送りしてほしい」「このバージョンはスキップしてもよいのでは？」なんて声が各部署から聞こえてきます。バージョンアップの価値を各部署に理解してもらうのは大変です。この文章はそんな時になぜバージョンアップしなければならないのかを上司や各部署のマネージャに伝えるために書きます。ソフトウェアの有効期限は2-5年まず、第一に、ソフトウェアというものは無限に使えるわけではなく、一定の有効期限があり、それを過ぎると徐々に動かなくなってきます。俗にいう「何もしてないのに動かなくなった問題」です。なぜ
Masanori Kusunoki / 楠正憲 on Twitter: "COCOAは途中まで私たち補佐官も入っていたので、決して運用保守を軽視したつもりはなかったのですが、EN API自体のプライバシー哲学に沿おうとすると既存のデバッグ用ツールがほぼ使えなくなってしまったのと、EN APIの更新がスマ… https://t.co/iQ5kltAo9k"
- 518 users
- twitter.com/masanork
- テクノロジー
- 2021/02/07
COCOAは途中まで私たち補佐官も入っていたので、決して運用保守を軽視したつもりはなかったのですが、EN API自体のプライバシー哲学に沿おうとすると既存のデバッグ用ツールがほぼ使えなくなってしまったのと、EN APIの更新がスマ… https://t.co/iQ5kltAo9k
- COVID-19
- COCOA
- 行政
- 開発
- あとで読む
- IT
- twitter
- 社会
- 運用
- API
Twitter障害はスクレイピングではなく“自己DDoS”が原因？
- 512 users
- www.itmedia.co.jp
- テクノロジー
- 2023/07/02
Twitterのオーナー、イーロン・マスク氏は7月1日、Twitterでの“サービスの低下”の原因を「数百の組織がTwitterのデータを極度なレベルでスクレイピングしている」ことだとツイートしたが、原因は別のところにあるようだと、フリーランスのWeb開発者、シェルドン・チャン氏がMastodonの投稿で指摘した。この“サービスの低下”で、多数のユーザーが投稿を読めなくなっている。マスク氏は2日、「極端なレベルのデータスクレイピングとシステム操作に対処するため」にユーザーが読める投稿数に制限を加えたとツイートした。だがチャン氏は、異常なトラフィックの原因として、TwitterのWebアプリのバグにより、無限ループ状態でTwitterにリクエストが送信されていることを発見したと動画を添えて説明した。この動画では毎分数百件のリクエストが送信されていることが確認できる。左の動画は、レートが
- 障害
- twitter
- トラブル
- あとで読む
- SNS
- web
- セキュリティ
- api
- trouble
- ネット
いつものように本番作業してたはずなのに - Qiita
- 509 users
- qiita.com/2gt
- テクノロジー
- 2019/12/01
この記事は「本番環境でやらかしちゃった人 Advent Calendar 2019」の1日目です。 https://qiita.com/advent-calendar/2019/yarakashi-production なかなか濃いラインナップが期待されますが、まずはさらっといきたいと思います。具体性が乏しい部分もあると思いますが、そこはお察しください。。。やらかし背景（前提条件）いっていに昔の話です ETL（データ加工）サーバ数十を超えるシステムからデータを集める BIツールなどで活用できるように各種加工処理を行い、DBなどにロードする繁忙の違いはあれど、24/365で常時一定量の処理は稼働している複数のチームが共存しているサーバアプリ面では比較的疎 ETL処理のリリース前に本番サーバ上で試験をする取り決めになっていた性能や本番相当データのテストが安全に行えるような環境
crontab database ～君がしでかしてくれたもの～ - Qiita
- 487 users
- qiita.com/raki
- テクノロジー
- 2019/12/02
この記事は本番環境でやらかしちゃった人のアドベントカレンダー２日目の記事です。内容的にそろそろ時効だと思うので供養のために書きました。追記。そういえば時期をちゃんと書いてなかったけど事件が起きたのは去年2018年、つまり仕込み（ヲイ）は2017年の話ですぶっちゃけネタ記事ですｗ（たまたま見つけて参加してみただけなのに昨日の記事の伸びっぷりを見て戦々恐々としてる TL;DR DB移行作業において、テスト期間中は常に最新のデータで処理できるように書いておいたプログラムをcrontabで実行していた。最終的に本番に合わせて日時を調整していたが、そのことを失念し１年後に再実行されてしまい、本番データが１年前に巻き戻る事故発生。 crontab は分、時、日、月、曜日を指定できるが、１年後に帰ってくるから気をつけてね。という話。惨劇はなぜおこってしまったのか結論から言えばcrontabの
- DB
- あとで読む
- qiita
- crontab
- 運用
- サーバ
- ネタ
- database
- 障害
- データ
デプロイ今昔 - Hatena Developer Blog
- 472 users
- developer.hatenastaff.com
- テクノロジー
- 2020/06/26
こんにちは。はてなのアプリケーションエンジニアの id:onk です。最近、若手エンジニアを中心に、いろいろな技術を見つめ直すワーキンググループをやっています。今回は、その中から「デプロイ」の会で発表されたことをまとめました（なお、私は会のとりまとめをやっている非若手です）。デプロイのライフサイクルの違い Infrastructure Platformでのデプロイ Application Runtime Platformでのデプロイ Applicationsのデプロイデプロイ方式はどのように変化してきたか In place から Blue/Green へ Immutable Infrastructure という考え方オートスケールへの対応 push 型デプロイと pull 型デプロイコンテナによるデプロイの現況コントロールプレーンによって何が変わったか ECS におけるデプロイ
- deploy
- デプロイ
- あとで読む
- DevOps
- infrastructure
- コンテナ
- ECS
- deployment
- aws
- hatena
全AWSエンジニアに捧ぐ、CloudWatch 設計・運用虎の巻 / CloudWatch design and operation bible
- 462 users
- speakerdeck.com/iselegant
- テクノロジー
- 2023/05/29
全AWSエンジニアに捧ぐ、CloudWatch 設計・運用虎の巻 / CloudWatch design and operation bible
- aws
- あとで読む
- 運用
- 設計
- cloudwatch
- monitoring
- 監視
- エンジニア
- design
- slide
アプリケーション開発者は Amazon ECS あるいは Kubernetes をどこまで知るべきか #AWSDevDay / You build it, you run it
- 414 users
- speakerdeck.com/toricls
- テクノロジー
- 2021/09/29
Talked at AWS Dev Day Online Japan 2021. - 動画: https://youtu.be/I7mMQshlpcs - イベントページ: https://aws.amazon.com/jp/about-aws/events/2021/devday - Proposal: https://github.com/aws-events/aws-dev-day-online-japan-2021-cfp/issues/16
- kubernetes
- aws
- ecs
- あとで読む
- コンテナ
- k8s
- 開発
- devops
- 運用
- amazon
Webアプリケーションのログに関するいくつかの考察 - Hatena Developer Blog
- 404 users
- developer.hatenastaff.com
- テクノロジー
- 2020/08/06
こんにちは、はてなでWebアプリケーションエンジニアをやっている id:polamjag です。最近のはてなでは、若手エンジニアを中心として、いろいろな技術を見つめ直すワーキンググループをやっています。先日、id:onk も「デプロイ今昔」という記事を書きましたが、このエントリーはそのシリーズの続きで、ワーキンググループの「ログ」の回で議論したこと・話題になったことをまとめました。 Web開発におけるログを見つめ直すログを4つの目的で分類する目的ごとに求められる取り扱いの要求水準いまどきのログフォーマットについてまとめ：どう実装するかを模索していく Web開発におけるログを見つめ直す Webサービス（Webアプリケーション）の運用には、多種多様なログがついてまわります。多くのミドルウェアは何もしなくてもそれなりの量のログを出力しますし、クラウド上のマネージドサービスも然りです。行
- ログ
- あとで読む
- logging
- log
- 運用
- web
- 開発
- エンジニア
- hatena
- データ
30分でわかるシステム運用アンチパターン / Operations Anti Patterns in 30 minutes
- 394 users
- speakerdeck.com/yuichielectric
- テクノロジー
- 2022/08/24
「システム運用アンチパターン - Forkwell Library #4」でお話しした際の資料となります。 https://forkwell.connpass.com/event/256481/ 動画はこちら。 https://youtu.be/hQAeMgXsZWc
- 運用
- あとで読む
- パターン
- システム
- サーバ
- DevOps
- slide
- SRE
- 開発
「運用組織」の考え方と設計〜運用組織論 2021 / 20210310-ssmjp-operation-organization
- 373 users
- speakerdeck.com/opelab
- テクノロジー
- 2021/03/11
ssmjp ssmonline #8 "第三回はたのさん祭オンライン"( https://ssmjp.connpass.com/event/206074/ )での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- 設計
- 組織
- あとで読む
- 考え方
- devops
- management
- ssmjp
- マネジメント
- 仕事
AWSコスト削減とリソース管理 | 外道父の匠
- 370 users
- blog.father.gedow.net
- テクノロジー
- 2023/08/24
クラウド使いなエンジニアの皆様、猛暑と円安の中いかがお過ごしですか。上層部からインフラコスト削減を突きつけられてはおりませんでしょうか。今回はおそらく初めてコスト削減についてAWSを軸に書いていきますが、考え方はどこの環境でも似たりよったりなので何かしらの足しになればと思う次第であります。目次長いです。ひきかえしたほうがいいぞ！コミュニティに捧げます AWSの売上コスト削減とは三大使命コスト状況整理 Load Balancer 参考リンク統合による削減 EC2 Autoscaling 参考リンク情報整理古いインスタンスタイプの変更スケジュールの調整スポットインスタンスの適用軽量インスタンスの統合・サーバーレス化アプリケーション処理の軽減 EC2 EBS EBSは高い不要EBSを削除・スナップショット化ボリュームタイプの変更 EC2 AMI NAT Gatew
- aws
- あとで読む
- コスト
- 運用
- CPU
- SRE
- 設計
- cloud
- 整理
- Amazon Web Services
なぜ日本の運用業務はつらいのか /20190910-most-important-for-operation
- 334 users
- speakerdeck.com/opelab
- テクノロジー
- 2019/09/11
運用現場が「つらい」のはなぜかについて説明した簡単な資料です。運用自動化や運用改善をする前に、一度じっくりと考えるための土台として作成しました。 (2019-09-12更新) - 「ダイジェスト」を追加しました。 - 「参考: 処方箋としての資料」セクションを追加しました。 (2019-09-11更新) - 「運用のつらさ」を説明するスライドを追加しました。 - 「海外の仕事のやり方 (運用業務を含む)」セクションを追加しました。 (運用設計ラボ合同会社波田野裕一)
- 運用
- あとで読む
- システム運用
- 資料
- マネジメント
- 日本
- management
- 仕事
- IT
- 組織
大規模オンプレミスなヤフーのサーバーインフラの裏側〜サーバー調達や運用の流れを紹介します
- 333 users
- techblog.yahoo.co.jp
- テクノロジー
- 2019/12/17
OEM系→ODM系にシフトした背景ですが、1つは価格競争力です。インフラにおいてプライスは重要な指標です。また昔と今でヤフーのサーバーの買い方に違いがある事もポイントになっています。昔のヤフーは、いろいろな部門が、いろいろな構成のサーバーを、いろいろなタイミングで購入していました。この結果、納期面で有利なOEMを第一選択肢としていました。またいろいろな構成のサーバーが入る事を考慮した結果、自営保守ではカバーしきれない範囲も多く、ベンダーが提供するサポートに依存している部分もありました。しかし最近では自社クラウド環境の普及により、決まった部門決まった構成決まったタイミングで購入するようにになってきたため、納期に関して余裕を持ったスケジューリングができるようになりました。またクラウド環境で利用できるサーバーはかなりハイスペックなため、価格の数％の違いも大きなビジネスイン
- インフラ
- あとで読む
- サーバ
- yahoo
- 運用
- server
- infrastructure
- hardware
- ヤフー
- Yahoo!
運用に携わる人全員に見てほしい！ Ops Guidesの紹介 - Qiita
- 319 users
- qiita.com/jacopen
- テクノロジー
- 2023/12/08
PagerDuty Advent Calendarの8日目！今日はOps Guidesのお話です。うちはこうだけど、他はどうやってるんだろう？普段から運用に関わっていると、ふとした瞬間に「そういえば他の会社ではどういう運用をやっているんだろう？」と気になること、ありませんか？そのきっかけは「本当になんとなく」といったものから「上手くいかない運用にフラストレーションが溜まって」というどす黒いものまで色々あると思いますが、いずれにせよ「他の会社の良いところを取り入れて、自分たちの運用を改善したい」という気持ちから来ているのは間違いないでしょう。だからこそ、いろんなミートアップに参加して発表を聞いたり、懇親会で話してみたり、Xに垂れ流されているいろんなポストを読んで事例を学ぶわけです。ベストプラクティスを学びたい! このような取り組みはとても良いことですし、是非とも継続して情報収集し
- 運用
- あとで読む
- devops
- qiita
- push
- サーバ
- システム
極めてAmazon的な"メカニズム"というお話｜Yuki Nakazato｜note
- 318 users
- note.com/upward_career
- テクノロジー
- 2020/12/28
今でこそクラウドやアレクサ、ビデオやミュージックといった多角的なビジネスを展開するアマゾンだが、もともとはオンラインの小売りであり、依然としてそれはビジネスの大きな部分を占めている。オンラインのコンシューマービジネスは、感謝祭時期のBlack FridayとCyber Mondayに照準を絞って（今はPrime Dayもあるが）、仕入れや配送センター及び実際の配送キャパシティの増強など、数か月前から準備に取り掛かり、その集大成としてこのPeak Periodを執行し、そして12月後半にはオフィスががらがらになる、というのが伝統芸である。9月後半か10月前半くらいになると、既に青色吐息の社員を見かけることも少なくない（そんな社員のためにお菓子やらが夕方になるとカートで運ばれてくる。残念ながら今年はなかったが）。アマゾンの強さの一つの理由は、私はこうしたピークシーズンに向けた過酷なOpera
- amazon
- あとで読む
- management
- 仕事
- 運用
- 文化
- AWS
ミラティブのサーバサイドをGo + Clean Architectureに再設計した話 - Mirrativ Tech Blog
- 313 users
- tech.mirrativ.stream
- テクノロジー
- 2020/11/30
こんにちは、テックリードの夏です。今年4月にCTOからテックリードに肩書が変わり、ガリガリコードを書くようになりました。背景については、こちらをご覧ください。 www.wantedly.com 普段はプロダクト側の機能開発と、サーバ側の基盤開発を半々ぐらいの割合で仕事しています。一口にサーバ側の基盤開発といっても定義が曖昧なのですが、基本的にはこんな感じのタスクをやっています。インフラコストの最適化不正なアクセスからの防御障害の再発防止新技術の導入やアーキテクチャの整備今回はこのうち「新技術の導入やアーキテクチャの整備」の中で、サーバサイドをGo + Clean Architectureで再設計したことについてお話したいと思います。背景ミラティブは2015年春頃に開発が始まり、同年8月にサービスがリリースされ、2020年8月で5周年を迎えました。その過程で組織やプロダ
運用改善、不都合な真実 / 20240722-ssmjp-kaizen
- 312 users
- speakerdeck.com/opelab
- 世の中
- 2024/07/22
ssmonline #43 での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- あとで読む
- 設計
- 資料
- 仕事
- management
- operation
- slide
- development
入門入門監視 / reading-practical-monitoring
- 303 users
- speakerdeck.com/o0h
- テクノロジー
- 2021/02/21
「入門監視」を読んだので、自分たちのチームに当てはめて考えてみる
- 監視
- あとで読む
- 運用
- monitoring
- slide
- book
- 入門
- dev
インフラエンジニアというキャリアの話 / be-infra-engineer!
- 301 users
- speakerdeck.com/udzura
- テクノロジー
- 2020/09/24
@フィヨルドミートアップ 2020/09/24
Kubernetesの自前運用は難しい？　はてなの撤退事例
- 287 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2019/11/08
はてなのMackerelチームはKubernetesクラスタを自前で構築して運用していたが、撤退を選択したという。なぜ、Kubernetesの運用を諦めて撤退を選んだのか。はてなのMackerelチームでSREを務める今井隼人氏が語った。コンテナ型仮想化技術を活用したアプリケーションの管理（オーケストレーション）ツール「Kubernetes」が注目を集めている。その背景の一端にあるのが、アプリケーションをコンテナ化し、マネージドKubernetesサービスで実行することによるメリットの享受と、運用負荷の軽減だ。参考記事：「Kubernetes」とは何か――コンテナ型仮想化の本番利用に向けた課題参考記事：「Kubernetesで運用する」その前に　Kubernetesを本番環境で利用する際のポイントそんな中、「Kubernetesクラスタを自前で構築して運用していたが、撤退を選択した
- kubernetes
- k8s
- あとで読む
- 運用
- はてな
- 事例
Kubernetesの自前運用はやっぱりツライらしい - orangeitems’s diary
- 282 users
- www.orangeitems.com
- テクノロジー
- 2019/11/09
Kubernetesの自前運用は難しいこれから嫌でもコンテナと戦わなければいかないインフラエンジニアには何度でも読み返してほしい記事です。 www.atmarkit.co.jp はてなのMackerelチームはKubernetesクラスタを自前で構築して運用していたが、撤退を選択したという。なぜ、Kubernetesの運用を諦めて撤退を選んだのか。はてなのMackerelチームでSREを務める今井隼人氏が語った。考察この話、20年前のLinux草創期を思い出すんです。雑誌の付録にLinuxがCD-ROMで付いてたんです。最近のスマートなCentOSとかじゃなくてですね、何Linuxだか忘れたのですがインストールも含めて3日間ぐらいかけて取り組んだんですが結局失敗した記憶があります。これからKubernetesなりコンテナがやってくるのはここ最近に書いた通りで、早くそっちの世界に行
- kubernetes
- あとで読む
- インフラ
- 運用
- コンテナ
- Linux
- k8s
- サーバー監視
- Docker
- Cloud
めんどくさい作業を改善できるようになるには - Konifar's ZATSU
- 272 users
- konifar-zatsu.hatenadiary.jp
- テクノロジー
- 2023/12/21
めんどくさい作業にぶち当たった時、一気に改善してしまう人がいる。ガッと自動化したり仕組みそのものを変えたりしてしまうのだ。「めんどくさい」と心の中で思ったなら、その時スデに行動は終わっているのである。たとえばコードレビューで都度同じ指摘をしだしたらLintとCIを整備したり、期限のリマインドを何度もしていたらリマインドそのものを自動化したり。CI/CDやBranch Protect Ruleを初期段階で整えるみたいな動きもそう。こういう動きができる人とできない人の違いは、大きく次の4つの段階に分けられる。 1. めんどくさいと自覚できるか 1つめはスタンスの問題かもしれない。「もっとよくできないか？」「なぜこれをやってるんだっけ？」といった感じで今の運用を疑ってみるのが第一歩である。よい状態を知っている方が当然自覚しやすいので、次の2とも密接に関係してくる。 2. めんどくさくない状
- エンジニア
- あとで読む
- 考え方
- 仕事
- プログラマ
- engineer
- 学習
- IT
監視の考え方〜あるいは可観測性とはなんなのか〜 - estie inside blog
- 270 users
- www.estie.jp
- テクノロジー
- 2023/02/15
みなさん、監視作ってますか？システムを作ったら、そのシステムを監視していく必要がありますよね。どうやったら「いい監視」が作れるのでしょうか。「いい監視」とそうでない監視との違いとは、いったいなんでしょうか。今の時代、「監視」ではなくて「可観測性」、 Observability (o11y) の時代になっていて、良いプラクティスや考え方が色々とあります。この記事は、監視や o11y についての考え方を社内に共有するため書いたものを、社外共有用に調整し直したものです。新しい Observability の時代を、一緒に生きていきましょう。監視を作ろうあなたはシステムを作りました。そのシステムに「監視」をつけようと思ったとき、最初にすることはなんでしょうか？まずは、システムを何らかのツールで監視するところから始めましょう。やらなきゃはじまらない。 Nagios, Cacti, Mun
- 監視
- monitoring
- SRE
- あとで読む
- observability
- 運用
- 考え方
- CPU
- サービス
- 設計
Googleでもやっている障害対応訓練の「Wheel of Misfortune」をやってみた。 - MonotaRO Tech Blog
- 256 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/09/06
序文こんにちは。MonotaROの伊藤です。弊社では障害対応訓練の実施手法の一つであるWheel of Misfortune(略称:WoM)を実践しています。WoMの導入で、障害対応体制の強化を行うことができましたので、実施までの経緯や得られた学びなどを中心に紹介したいと思います序文運用担当者の負荷が高まり続ける問題運用担当者=社歴が長いベテランエンジニア運用のスケールアウト障害対応訓練をやってみよう訓練環境の準備の問題訓練シナリオの問題外部からの助け Wheel of Misfortuneとは実施時の様子シナリオ開始時の様子モニタリング画面の表示 WoMとDiRT(Disaster in Recovery Training) 障害対応訓練をやってみた結果準備時点で感じたメリット手順書の不備を発見できたこと障害が起こりかねない場所を考えるきっかけになったこと
GitHubの運用を「会社」にしていく話
- 253 users
- zenn.dev/ubie_dev
- テクノロジー
- 2022/02/04
Ubie DiscoveryでSREなどをしている@itkqです。 UbieではGitホスティングにgithub.comを使っています。プロダクト開発に必要なprivateなコードベースはもちろん、OSSや就業規則といったドキュメントをpublicにホストしたりもしています。また、この記事を書いている時点で、メインのOrganizationのメンバーは121名です。自分が入社したのは一年前（2021年1月）で、まだ情報システム専任の人がいませんでした。それから今に至るまで、GitHubの運用を「会社」にしていく話を書きます。一年前のGitHubの運用当時、UbieのOrganizationに所属していた人数は、業務委託含め80〜90名ぐらいで、Businessプランを利用していました。私はSREとして入社しましたが、情報システム専任の人がおらず、SREをはじめとする何名かのメンバーが
- github
- あとで読む
- セキュリティ
- SRE
- 運用
- SAML
- security
SREはインフラエンジニアだけでなく、みんなの活動 - ytake blog
- 251 users
- blog.ytake.jp.net
- テクノロジー
- 2023/08/27
みなさんSREしてますか？サービスなどの品質を維持していくために切っても切り離せないSREですが、日本でもSREという言葉が定着しつつあるかと思います。このSREについて書いていきたいと思います。 SRE NextのCFP忘れてたのでその代わりに・・ SREってインフラですよね？非常によくあるケース、というか多分ほとんどがこうなっていると思います。もちろん会社としてインフラのことを指しても問題はありませんが、 SREとはどういうものなのか、正しく認識して今一度現状を振り返ることでさらに良い活動に繋がることが多いと思います。なんのこっちゃ、という方も多いかもしれません。 SREはエラーバジェットなどの話が必ず出てきますので、モニタリングや監視などが必ずセットにはなっていきます。ですが、この部分が強調されているのかどうしてもインフラエンジニアでしょ、というのが定着している場
- SRE
- あとで読む
- devops
- インフラ
- 運用
- 開発
- エンジニア
- 知識
- サービス
【保存版】東京リージョンの AWS 障害発生時にクラスメソッドのテクニカルサポートチームがやっていること | DevelopersIO
- 251 users
- dev.classmethod.jp
- テクノロジー
- 2021/03/29
どのような事前準備をしているか有事の際は想定外のことが発生しやすく、事前準備をしていないと冷静な対応が難しくなります。いきなりしっかりした事前準備をすることは難しいので、徐々に成熟度を上げていきます。本章では以下の観点で、事前準備についてご紹介します。手順書自動化訓練手順書フローやチェックリストを含む手順書を準備しています。手順書の内容は後述します。分かりやすい手順書を準備することも重要ですが、その手順書への導線づくりも大切にしています。運用周りのドキュメントは数が多く、目的のドキュメントが埋もれてしまい他のメンバーが見つけられない場合があるからです。周知に加えて、ドキュメントの階層を見直したり、特定チャンネルに手順書の URL をピン留めしておくなど、手順書に辿り着きやすくする工夫をしています。分かりやすい手順書の書き方については、以下のブログが参考になります。
- aws
- 障害
- あとで読む
- 障害対応
- 運用
- failue
- Slack
- チーム
- 仕事
- 東京
私がインフラ運用保守で意識して行っていること(コラム) - Qiita
- 249 users
- qiita.com/ponponpoko
- テクノロジー
- 2023/03/06
～はじめに～運用保守は、手順書通りするだけの楽な業務と勘違いしていませんか？私は3年間運用保守(インフラ)に携わり、手順書作成や障害対応/調査、運用支援など様々なことを行ってきました。そんな私が思うに運用保守は、全くそんな楽な業務でありません。運用保守は過信と油断をすれば、すぐに業務影響を出してしまいます。構築設計段階でのお客様に影響を出すのとは、全く影響度合いが違います。既に稼働しているシステムで業務影響を出すというのは、エンドユーザーへ多大なるご迷惑をおかけするということ、つまり絶対に許されません。そんな状況にならないために、私が運用保守をする上で意識して行っていることについて書きたいと思います。～運用保守をする上で意識して行っていること～ 1. 簡単な作業や慣れた作業でも慎重に行う私はどんな作業だとしても、過信や油断をせずに慎重を行うようにしています。簡単または慣れ
モノリスの分解において、マイクロサービスは必然ではない - QCon LondonにおけるSam Newman氏の講演より
- 241 users
- www.infoq.com
- テクノロジー
- 2020/06/30
Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...
Webアプリケーションの障害対応について改めて意識すべき点ややれると良いことをまとめる - stefafafan の fa は3つです
- 238 users
- blog.stenyan.jp
- テクノロジー
- 2020/09/07
Webアプリケーションエンジニアをやっていると時たま障害が発生し復旧作業にあたるのだが、人によって「障害対応が得意」だったり「苦手」だったりする。ただ、障害対応時の「良い動き」というのが実際どういうものなのかというのが自分の中でふんわりしていたので、ざっくりはてブで「障害対応」で検索していくつかのエントリーを読んでみたり、自分の仕事での経験を振り返ってみたりして考えたことをまとめてみた。障害にはフェーズがある障害対応には複数の役割がある障害対応をスムーズに進めるための目的は複数あるスキルも必要なので練習していけると良い初心者でもやれることはある実際やってみると良さそうなこと障害対応時にやることをテンプレート化するスムーズに対応に入れる仕組みを整える障害対応避難訓練おわり障害にはフェーズがある障害対応したことないと、障害には「障害中」「障害中でない」の二つの状態しかな
- 運用
- あとで読む
- 障害
- テンプレート
- web
- システム
- 開発
- security
- 障害対応
- 仕事
latestタグのままdocker imageを本番運用してどうなったか - 京都行きたい
- 228 users
- progret.hatenadiary.com
- テクノロジー
- 2020/01/23
latestタグや書き換えるためのタグ（develop, stagingなど）を使って、本番で運用するのはやめましょう。コンテナイメージのキャッシュ状況やリリースフローによっては予期しない形で予期しないバージョンが本番で起動する可能性があります。本記事では、どのプラットフォームやツールで発生したかについては記載しません。本題はそこではないのと、そもそも運用が間違っているので記述しても余計な枝葉になるからです。この記事ではどういうことが起きたか、について書きます。どういうことが起きたかサービスで、dockerイメージのlatestタグを使って本番運用していた。全コンテナをgraceful restartしたようだ。（つもりだったが・・・）別の作業中、管理画面の表示がおかしくなっているという話が出てきた。そこで調べてもらったところ、なぜかリリースしたはずの機能が正常に機能