タグ

運用に関するot2sy39のブックマーク (33)

  • Microsoft Entra セキュリティ運用ガイド - Microsoft Entra

    Microsoft では、コントロール プレーンとして ID を利用した多層防御原則により、実績のあるゼロ トラスト セキュリティへのアプローチを成功させてきました。 組織はスケール、コスト削減、セキュリティを追求し、ハイブリッド ワークロード環境を受け入れ続けています。 Microsoft Entra ID は、ID 管理の戦略において非常に重要な役割を果たします。 最近では、ID とセキュリティの侵害に関するニュースにより、企業の IT 部門は、ID セキュリティ態勢を、防御的セキュリティ成功の指標として捉えるようになりました。 さらに組織はオンプレミスとクラウドのアプリケーションを組み合わせて使用する必要があり、ユーザーはそれらのアプリケーションに、オンプレミスとクラウド専用の両方のアカウントでアクセスします。 オンプレミスとクラウドの両方でユーザー、アプリケーション、デバイスを管理

    Microsoft Entra セキュリティ運用ガイド - Microsoft Entra
  • RTX1200の状態をMackerelに監視させる - Qiita

    12/3 Mackerelアドベントカレンダー 3日目です。 昨日は @daiksy さんによるエントリでした。 プロダクトとユーザの距離感について考えてみる http://blog-ja.mackerel.io/entry/advent-calendar2015/day2 Mackerel のメール、毎回楽しく読んでます! 何したの? Mackerel 自体については、既に家の中のサーバーや VPS などを監視しており、agent 入れるだけでこんなにできるんだ、便利だなーというところで止まっていました。 何か面白いことができないかな、と思っていたら、最近買って家に導入した RTX1200 (当はIPX) というルーターが目に入ったので、以前から気になっていた API の使い方を調べて、実際にルーターのメトリックを Mackerel に集約してみました。 RTX シリーズ、およびほかの

    RTX1200の状態をMackerelに監視させる - Qiita
    ot2sy39
    ot2sy39 2019/12/16
    別ホストにmackerel-plugin-snmp入れるのと、httpsのためにプロキシ立てるのとどっちが楽だろうと思ったが、いつからか分からんけどluaでhttps使えるようになっているみたい。であれば単体でできるこちらの方が管理楽かな。
  • ネットワークの監視 ~ mackerel-plugin-snmpを読み解く - そーだいなるらくがき帳

    この記事は Mackerel プラグインアドベントカレンダー(全部CRE) の23日目です。 qiita.com soudai.hatenablog.com それでは23日目は mackerel-plugin-snmp です。 mackerel-plugin-snmpはSNMP (Simple Network Management Protocol)をつかってデータを取得し、それを可視化するSNMP専用のプラグインです。 github.com インストールと設定手順 mackerel-plugin-snmpのプラグインは先程も説明したとおりSNMPを利用します。 そのため、対象にはSNMPが利用できる設定がされていることが条件になります。 ですがSNMPを使いたい=ある程度ご理解がある前提なので割愛します。 そもそもSNMPについては良い資料が沢山あります。 例えば下記のサイトがとてもわか

    ネットワークの監視 ~ mackerel-plugin-snmpを読み解く - そーだいなるらくがき帳
  • mackerel-agent + snmpで RTX1200 のメトリクス取得 | tech - 氾濫原

    検索すると Lua スクリプトを RTX にいれる方法もあるみたいだが、別途プロキシが必要みたいなので LAN 内の raspberrypi から SNMP で取得して投げるほうを選んでみた。raspberrypi には既に mackerel-agent が入れてあるので、追加の設定をするだけ。 mackerel-agent-plugins mackerel-agent は arm 版もリリースされているが、プラグインはリリースされていない。自分でビルドする必要がある。 mackerel-plugin-snmp だけあればいいので、mackerel-plugin-snmp のディレクトリで env GOOS=linux GOARCH=arm GOARM=5 go build するだけでバイナリができる。できたバイナリを raspberrypi の /usr/local/bin とかにコピー

  • cron哀歌~typoを笑うものはtypoに泣く~他 - Qiita

    この記事は「番環境でやらかしちゃった人 Advent Calendar 2019」の12日目です。 https://qiita.com/advent-calendar/2019/yarakashi-production (想像以上に人気のカレンダーに参加してしまい、正直なところ、戦々恐々としております……) はじめに ほとんどの方ははじめまして、 @NACK と申します。 エンジニアになって何十年も経ちますが、未だに、ここに書いた「やらかし」は夢に見ます。 皆さんにご笑覧いただいて、私も一緒に笑えるようになればいいなあ……と思い、今回の企画に参加させていただきました。 というわけで、ぜひ笑いとばしていってください。もしくは、今後のみなさんの業務に、ほんの少しでもお役に立てれば幸いです。 用語説明 typoとは 入力ミスのこと。"typographical error"の略。 http:/

    cron哀歌~typoを笑うものはtypoに泣く~他 - Qiita
    ot2sy39
    ot2sy39 2019/12/16
    typo対策で「一度テキストファイルに書いてコピペ」というのがよくあるけど、複数行一気に流れたりして、逆に凄い怖いんだけど。俺だけ?
  • SpotifyがミスによりKubernetesの本番クラスタを二度も削除。しかし顧客へのサービスにほとんど影響しなかったのはなぜか?

    SpotifyがミスによりKubernetes番クラスタを二度も削除。しかし顧客へのサービスにほとんど影響しなかったのはなぜか? 今年、2019年5月20日から3日間にわたりスペイン バルセロナで開催されたKubeCon+CloudNativeCon Europe 2019の基調講演では、SpotifyがミスによってKubernetesのクラスタを消去してしまった経験を振り返るという非常に興味深いセッション「Keynote: How Spotify Accidentally Deleted All its Kube Clusters with No User Impact - David Xia」(基調講演:SpotifyはいかにしてKubernetesクラスタの全削除というミスにもかかわらず顧客への影響を引き起こさなかったのか?)が行われました。 障害が起こることをあらかじめ計画とし

    SpotifyがミスによりKubernetesの本番クラスタを二度も削除。しかし顧客へのサービスにほとんど影響しなかったのはなぜか?
    ot2sy39
    ot2sy39 2019/07/08
    「リストアのテストをしていないバックアップは、バックアップの意味をなしていない」これよ。
  • O'Reilly Japan - 入門 監視

    あなたのシステムはきちんと動いていると言えますか? 書は、システムのどの部分をどのように監視すべきか、また監視をどのように改善していくべきかについて解説する書籍です。 前半で監視のベストプラクティス、デザインパターン/アンチパターンを示して、監視の基原則を詳しく説明し、後半でフロントエンド、アプリケーション、サーバ、ネットワーク、セキュリティの各テーマで強力な監視の基盤を設計して実装するための方法を示します。 監視対象が変化し、システムアーキテクチャが進化する中で、従来から変わらない監視の基を示しながら、時代に合った監視の実践を解説する書は、監視についての理解を深めたいエンジニア必携の一冊です。日語版では、松木雅幸(@songmu)氏による監視SaaSの導入や活用方法を付録として収録しています。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載して

    O'Reilly Japan - 入門 監視
    ot2sy39
    ot2sy39 2018/12/20
    これは買う。しかしどのフォーマットを買うべきか。紙か?
  • 「手順書」のススメ - Masteries

    こんにちは, id:papix です. この記事は, 「はてなエンジニア Advent Calendar 2018」の9日目の記事です. qiita.com 昨日は id:wtatsuru さんによる, 「基盤開発観点からみたはてなAWS活用のこれまでとこれから」でした. wtatsuru.hatenadiary.com 「手順書」のススメ さて, 早速題に入っていきましょう. 皆さんは「手順書」を書いていますか? 自分はと言うと, 最近そこそこの規模のオペレーションが必要なタスクを担当する機会が多く, その度に手順書を書いて, レビューしてもらってからオペレーションをするようにしています. 例えば, 今年実施した「はてなが提供するドメインを利用したブログのHTTPS化対応」のリリースの時は, このような手順書を書いていました: この時は, GitHubのIssueに手順書を用意してい

    「手順書」のススメ - Masteries
    ot2sy39
    ot2sy39 2018/12/10
    問題は、3年に1回の作業とかで、2年後にシステムに変更が入って手順書修正する必要があるのに誰も気づかないってヤツ。
  • 運用自動化、不都合な真実 // Speaker Deck

    ssmjp 201712 はたのさん祭での「運用自動化、不都合な真実」の発表資料です。 詳細: https://www.opslab.jp/publish/20171212-ssmjp-automation.html (運用設計ラボ合同会社 波田野裕一)

    運用自動化、不都合な真実 // Speaker Deck
  • IIJ Technical NIGHT vol.3 ~まだアラート対応で消耗してるの?~ #iij_technight

    https://atnd.org/events/90140 引用:『3回目となる今回のテーマは「アラート対応の自動化」です。 インフラエンジニアを24時間悩ませ続けるアラート対応。でも、そのアラート当に人手で対応が必要なので しょうか?IIJが運用している多数のシステムから日夜限りなく発生するアラートと向き合ってきたエンジニアが、アラート内容の分析と、その対応の自動化に取り組んだ模様をご紹介します。』

    IIJ Technical NIGHT vol.3 ~まだアラート対応で消耗してるの?~ #iij_technight
    ot2sy39
    ot2sy39 2017/09/01
    行きたかった。
  • ルーターのコンフィグを git にぶち込んで世代管理してみたはなし - miyalog

    この記事を三行で みんな好き勝手な名前でコンフィグファイルをアップロードしてサーバーがパンク&どれが最新版かわからない状況に 命名規則を作り、サーバーに置いておくコンフィグを最新世代1つのみとした さらにファイルを社内 GitLab に自動アップロードし履歴確認ができるようにした ※ GitLab を入れ物として使うだけで、git を使ったワークフローを導入したとかのカッコイイ話じゃありません あらまし とある通信会社の委託でIPネットワークの監視作業員をやっています(非エンジニア)。うちの会社ではルーター・スイッチ類のコンフィグをTFTPサーバーへアップロードしてバックアップとしていますが、先日そのサーバーで反応が5分くらい返ってこなかったり、ファイルのアップロードに失敗したりと動作が不安定に・・・。HDDでも壊れたかな?と思いながら調べてみると... $ df -h Filesyste

    ルーターのコンフィグを git にぶち込んで世代管理してみたはなし - miyalog
  • GitLab.comが操作ミスで本番データベース喪失。5つあったはずのバックアップ手段は役立たず、頼みの綱は6時間前に偶然取ったスナップショット - Publickey

    果たしてGitLab.comで何が起きたのでしょうか? これまでの経緯をまとめました。 スパムによるトラフィックのスパイクからレプリケーションの不調へ GitLab.comは今回のインシデントについての詳細な経過を「GitLab.com Database Incident - 2017/01/31」で公開しています。また、もう少し整理された情報がブログ「GitLab.com Database Incident | GitLab」にも掲載されています。 これらのドキュメントを軸に、主なできごとを時系列に見ていきましょう。 1月31日16時(世界協定時。日時間2月1日午前8時)、YP氏(Yorick Peterse氏と思われる)はPostgreSQLのレプリケーションを設定するためにストレージの論理スナップショットを作成。これがあとで失われたデータを救う幸運につながります。 1月31日21時

    GitLab.comが操作ミスで本番データベース喪失。5つあったはずのバックアップ手段は役立たず、頼みの綱は6時間前に偶然取ったスナップショット - Publickey
    ot2sy39
    ot2sy39 2017/02/02
    うちはバックアップ大丈夫だろうな?といった問合せがまったくない。上司や更にその上、あるいは委託元がこういうニュースにアンテナ張ってないことがわかった。
  • Cookpad TechConf 2017 提供 Wi-Fi の裏側 - クックパッド開発者ブログ

    インフラ部 id:sora_h です。 先週開催された Cookpad TechConf 2017 如何でしたでしょうか。わたしは TechConf において Wi-Fi を担当していて、こちらも好評いただいたようでなによりでした。 というわけで、この記事では TechConf 2017 における Wi-Fi についての詳細を紹介します。 ネットワーク機器設定・サーバー mitamae レシピ等の公開 https://github.com/cookpad/techconf2017-network 今回の紹介する構成のうち、ネットワーク機器およびサーバ側の設定等、ほとんどを GitHub で公開しています。参考までにどうぞ。 TechConf 2017 NOC メンバー 実は外注などはしておらず、社内 IT と SRE グループのメンバーで構成されていました。 メイン (設計・運用・設営)

    Cookpad TechConf 2017 提供 Wi-Fi の裏側 - クックパッド開発者ブログ
  • 運用監視に必要な知識はOS、コマンド、そしてプログラミング~ゼロからの運用監視設計(後編)。July Tech Festa 2016

    運用監視に必要な知識はOS、コマンド、そしてプログラミング~ゼロからの運用監視設計(後編)。July Tech Festa 2016 運用監視の自動化は、複雑化するアプリケーションやサービスに対して効率的かつ確実な運用監視を実現する上で、またコスト削減の意味でも重要な要素になってきています。しかし運用監視の自動化は、どのように考えて実現していけばいいのでしょうか。 (記事は「正しく運用されているかを評価するのが監視である~ゼロからの運用監視設計(前編)。July Tech Festa 2016」の続きです。) ゼロからの監視設計 ひとつはサービスレベルの定義、もうひとつは非機能要件としてのシステム監視ですね。こういうことは以外と職場でも学校でも教えてくれなかったことです。 なぜかというと、だいたい担当部署によってみているレイヤが違うわけです。物理層を見ているところ、ネットワーク層、あるい

    運用監視に必要な知識はOS、コマンド、そしてプログラミング~ゼロからの運用監視設計(後編)。July Tech Festa 2016
    ot2sy39
    ot2sy39 2016/10/19
    構築と運用の末端レベルのスキルギャップは埋らないと思うが、構築部門管理者と運用部門管理者をキャリアルート上で交差させる(2年交代にするとか)ことで、運用を考えた構築、構築を考えた運用ができると思う。
  • 業務委託先の元社員の逮捕について | ソフトバンク

    業務委託先の元社員の逮捕について 2011年7月8日 ソフトバンクモバイル株式会社 2011年5月25日に発生した関西地域(大阪府、兵庫県、京都府、滋賀県、奈良県)における通信障害について、日、当社の業務委託先の元社員が、監視および制御を行うサーバーを経由して基地局とネットワークセンターを結ぶためのATM伝送装置の回線設定データを改ざんし、約7万2700人の利用者に通信障害を発生させた容疑で逮捕されました。 件については、外部からの不正アクセスの痕跡もなく、人為的事故の可能性があると思われたことから、障害発生の翌日5月26日に大阪府警に相談し、6月6日に被害届を提出しています。捜査協力の観点から公表を差し控えてまいりましたが、被疑者の逮捕を受け、当該事案の概要をご報告いたします。 ご利用のお客さま、関係者のみなさまに多大なご迷惑とご心配をおかけし、深くお詫び申し上げます。 当社は今後も

    業務委託先の元社員の逮捕について | ソフトバンク
    ot2sy39
    ot2sy39 2016/08/20
    対策みたけど、これでは防げないんじゃないか?
  • Linuxサーバにログインしたらいつもやっているオペレーション - ゆううきブログ

    主にアプリケーション開発者向けに、Linuxサーバ上の問題を調査するために、ウェブオペレーションエンジニアとして日常的にやっていることを紹介します。 とりあえず調べたことを羅列しているのではなく、当に自分が現場で使っているものだけに情報を絞っています。 普段使っているけれども、アプリケーション開発者向きではないものはあえて省いています。 MySQLNginxなど、個別のミドルウェアに限定したノウハウについては書いていません。 ログインしたらまず確認すること 他にログインしている人がいるか確認(w) サーバの稼働時間の確認 (uptime) プロセスツリーをみる (ps) NICやIPアドレスの確認 (ip) ファイルシステムの確認(df) 負荷状況確認 top iostat netstat / ss ログ調査 /var/log/messages or /var/log/syslog /

    Linuxサーバにログインしたらいつもやっているオペレーション - ゆううきブログ
  • 【社内資料公開】構築担当者向け 運用チームに引き継ぐ時に気にしてほしい3つのポイント | DevelopersIO

    はじめに こんにちは植木和樹@上越妙高オフィスです。AWS上でのインフラ構築が終わり、アプリケーションがデプロイされるといよいよサービスローンチ。数日〜数週間様子をみて問題がなければ運用チームに業務を引き継ぐことが多いかと思います。 運用チームへの引き継ぎ資料を作って「あとはよろしくね」となるわけですが、その段階で「待て」がかかってしまうことがあります。(だいたい待てを言うのは私なんですが) 今回はスムーズに運用チームに業務引き継ぎができるように、私が注意しているポイントをまとめておきたいと思います。 3つのポイント 注意するポイントは3つです。 1. Input なにをトリガーに作業が始まるのか。どんな通知がくるのか。 2. Action 何をするのか。 3. Output 作業が終わったら誰に報告するのか。 1つずつ説明していきます。 1. Input 運用チームは基的に「イベント・

    【社内資料公開】構築担当者向け 運用チームに引き継ぐ時に気にしてほしい3つのポイント | DevelopersIO
    ot2sy39
    ot2sy39 2015/07/28
    別エントリで見たが、保守部門管理者と構築部門管理者を2年くらいで交代させるといいと思うよ!
  • 圧倒的な技術力が求められる職種だ /「ウェブオペレーション」を読んだ - kakakakakku blog

    ずっと読もうと思っていたけど読めていなかった「ウェブオペレーション」を読んだ.読んでたら週末終わってしまった! 2011年に発行されただし結構古くなってるのかなとも思ったけど,全然そんなことなく,今読んでも目から鱗な知見ばっかりだった.確かにウェブオペレーションを取り巻く環境は広くなってたり,デファクトスタンダードな技術も推移して便利になってきているけど,マインドの部分は不変なものだなと感じた. ウェブオペレーション ―サイト運用管理の実践テクニック (THEORY/IN/PRACTICE) 作者: John Allspaw,Jesse Robbins,角征典出版社/メーカー: オライリージャパン発売日: 2011/05/14メディア: 大型購入: 10人 クリック: 923回この商品を含むブログ (50件) を見る ビジネスメトリクス メトリクスって言うと Zabbix や Mack

    圧倒的な技術力が求められる職種だ /「ウェブオペレーション」を読んだ - kakakakakku blog
    ot2sy39
    ot2sy39 2015/07/13
    アラートの項が耳に痛い。無視していいアラートは限りなく減らすべき。でもなかなか難しい。
  • ミスをエンジニアリングすることについて、例えばなぜ自動化するのかについて−−『「事務ミス」をナメるな!』を読んで - Line 1: Error: Invalid Blog('by Esehara' )

    はじめに 今更いうことではないのだけれど、自分は凡ミスの多い人間だという自覚がある。例えば、このブログを書いていたとしても、結構な割合で「てにをは」を間違えることが多いし、また予定等を勘違いして、実は期日を過ぎていたということもある。 そういうこともあってか、「こういう単純な凡ミスを無くす」ことが出来ないかなと思って、を手に取ったのだけど、いい意味で裏切られた。いい意味、というのは、そののタイトルに反して、要するに「ミスをエンジニアリングするということがどういうことか」ということが書かれていたからだ。このはタイトルで純粋に損しているとは思う。 個人において「ミスをする」ということはどういうことか 大抵、人間が何かをミスする場合、そのミスというのは無能であるか、あるいはうっかりといったような「能力の欠如」として捉えることが多い。しかし、書の場合、それよりかは、むしろ「人間の知恵が働き

    ミスをエンジニアリングすることについて、例えばなぜ自動化するのかについて−−『「事務ミス」をナメるな!』を読んで - Line 1: Error: Invalid Blog('by Esehara' )
    ot2sy39
    ot2sy39 2015/03/26
    とりあえずアマゾンのほしい物リストに入れた。セールのチャンスをうかがう。
  • 「Windowsでの自動化について考える会」を開催してきました #WinAutoMate - HIDARI日記(右)

    今日は Windowsでの自動化について考える会 - connpass を開催してきました。 実は見切り発車感の強い企画ではありましたが、蓋を開けてみるとキャンセル待ちまで出るほど多くの方に興味を持っていただけたみたいで、かつ僕自信にとっても非常に勉強になることが多い有意義な勉強会になりました。 参加者、発表者、そして会場を提供していただいたMOTEX様、ありがとうございました。お疲れ様でした。 発表の概要のようなもの 日の発表資料はすべて公開されています。 Windowsでの自動化の手段 from Hidari 僕の発表ではこの勉強会の導入として、自動化の「手段」について駆け足で紹介。 個人的に興味のあるプロダクトの名前もこっそり混ぜつつ、僕なりの解釈とゆるく絡めて話しました。 Windowsの自動化今昔先夢語 from 森理 麟 続いて森理麟さんから。自身がこれまでに行ってきた身の

    「Windowsでの自動化について考える会」を開催してきました #WinAutoMate - HIDARI日記(右)