[B! 運用] shufoのブックマーク

キンタマという脆弱性

神「運用でカバーをお願いします」

shufo 2016/04/28

運用

リンク

我々はどのように冗長化を失敗したのか yapcasia2015 // Speaker Deck

我々はどのように冗長化を失敗したのか

shufo 2015/08/22

リンク

Consulと自作OSSを活用した100台規模のWebサービス運用

YAPC::Asia 2015 http://yapcasia.org/2015/talk/edit/b335dee0-09ad-11e5-8d7a-67dc7d574c3a

shufo 2015/08/21

リンク

AWS 権限管理のベストプラクティスについて考えてみた | はったりエンジニアの備忘録

AWS は Management Console や API ですべて操作できます（Direct Connect など一部例外もあります）。データセンターの物理的なセキュリティなどは AWS が責任を負うところで、ユーザーはまったく意識する必要はありません。その代わり、OS やミドルウェアの管理、アプリケーションの設計や実装、適切な権限管理などはユーザーが責任を負うところです。今回はあまり取り上げられないけど、すごく大事な権限管理についてまとめてみました。自分が仕事で関わっているプロダクトで権限管理を見直すときに調べたことをベースにしていますが、もっと良いプラクティスがあればぜひ教えてください。 AWS アカウントは使わない普段の運用で AWS アカウントは使いません。 AWS アカウントとは、最初にサインアップするときに作られるアカウントです。このアカウントは Linux で言う

shufo 2015/08/06

aws
運用

リンク

Designing for Scale - Three Principles and Three Practices from Tapad Engineering - High Scalability -

shufo 2015/05/13

リンク

なぜネットワーク運用自動化が進まないのか Why is it difficult �to automate network operation

2015/4/24に開催された wakamonog x ssmjp x BIGLOBE = wasabi イベントで発表した資料です。http://ssmjp.connpass.com/event/13173/ This is lightning talk presentation for study event in Tokyo.Read less

shufo 2015/04/25

リンク

Webオペレーションエンジニアのアウトプットと開発力 - 人間とウェブの未来

という話を、社内のインフラチーム向けにしました。 Webオペレーションエンジニアの大体のイメージについてはこちらを御覧ください。書評なのですが、とてもイメージしやすいエントリになっていると思います。 blog.riywo.com スライドの中でも一応定義していて、３行にまとめると Webサービスの運用 OS・ミドルウェアの運用運用技術の調査・開発を主な業務として行っているエンジニアを指すことにします。入社して間もないので、僕の人格の好き嫌いや人間関係みたいなものがまだできていない頃の発表ということで、素直に内容を聞くことができる、という意味でいい機会だったと思います。この内容は、社内だけでなく社外のWebオペレーションエンジニアや、所謂、インフラエンジニアと呼ばれている人でも同じような悩みを抱えている人がいるかもしれないと思っていて、内容的にも公開しても良い話なので公開しようと思い

shufo 2015/04/20

リンク

12 Factor App - モダンなサービス運営に必要な12のインフラ的要素 - Qiita

皆さんは、The Tweleve-Factor Appをご存知だろうか？これはHerokuの中の人が書いた、Webアプリケーションを使いやすい形でスケーラブルにするための方法論である。簡単にいえばコンテナで動かしたいアプリケーションが守っておくとよいレシピ集であると言える。 http://12factor.net/ (日本語訳) 今回これを取り上げた背景としては、実はDockerコンテナをメインにした本番でのインフラ運用を考えた時に、アプリケーションがこの12の要素を満たしていることが重要だと最近ひしひし感じているから。実際、自分が働いているところが運営しているサービス Wantedlyは、もともとずっとHerokuで運営していて、最近AWSに移行し、現在Dockerコンテナの上で動いている。この移行を約1ヶ月半で実現できた大きな要因として、Herokuの上に乗っていたことで知らず知ら

shufo 2015/03/17

リンク

Software Design 2015年2月号『なぜ「運用でカバー」がダメなのか』読了 - そのねこが学ぶとき

Software Design (ソフトウェアデザイン) 2015年 02月号 [雑誌]posted with amazlet at 15.02.11 技術評論社 (2015-01-17) Amazon.co.jpで詳細を見る読んだ。身に覚えがありすぎるもので（震え声）そもそもにして「運用でカバー」という言葉自体が思考停止しているというか、その実態は何で何が問題なのよ？というのをよくよく考えもせず「なんとなくまずそうだよね」状態で停まっている気がするのですが、そういうのをきちんと論理的に客観的に解きほぐして脱却していくってのは非常に重要なことだなと、この特集読んで思いました。たぶん、そういうこと他にもいっぱいある。「運用でカバー」とはすなわち、「仕様外の依頼をなんとなくもやっと渡しても、運用現場の努力でなんかなんとなくやっちゃう」ってやつで、特集内ではその帰結として現場の高負荷、業

shufo 2015/02/24

リンク

アラートの指針 - tl;dr

My Philosophy on Alerting - Google ドキュメント http://robewaschuk.tumblr.com/post/48822960728/my-philosophy-on-alerting My Philosophy On Alerting 元 Google "Site Reliability Engineer" で現 Tumblr？の著者 Rob Ewaschuk による、サービスモニタリングとアラートに関する原則。アラートによる呼び出し（page）は以下の要件を具えていなければならない。緊急のものであること。重要なものであること。行動を起こすことが可能であること。知性が必要なものであること。機械的対応でよいのなら、アラートは無意味。現実に則したものであること。現在サービスに起こっている・起ころうとしている問題をあらわしていなければ

shufo 2015/01/09

リンク

グリーを支える通知システム | GREE Engineering

はじめにこのエントリは GREE Advent Calendar 2014 24日目の記事です。こんにちは、インフラストラクチャ本部の高野(@takano32)です。いつも社内では GitHub:Enterprise の運用、デプロイの改善、大規模なインフラを操作するためのツール作成、レガシーなサーバのセキュリティ対策、コミュニケーションツール向けシステムの構築・運用、などの仕事をしています。節操がありませんね。はい。そのうち、今回は「コミュニケーションツール向けシステムの構築・運用」のうち「グリーを支える通知システム」という題目について書きたいと思います。グリーとリアルタイムコミュニケーションツールまず、通知システムについてお話する前に、グリーでどのようなリアルタイムコミュニケーションツールが利用されてきたかを簡単に説明したいと思います。リアルタイムコミュニケーシ

shufo 2014/12/24

リンク

プッシュ通知の基礎知識＆秒間1万を超えるプッシュ通知基盤のアーキテクチャと仕組みとは

連載目次プッシュ通知とは？なぜ開発者はアプリにプッシュ通知機能を搭載するのかスマートデバイスにおける「プッシュ通知」はアプリにとって欠かせない機能の一つであり、メールマガジンと同様に重要な集客ツールです（図1）。スマートフォンをお使いの方でしたら、一度はプッシュ通知を受け取ったことがあるのではないでしょうか。プッシュ通知はユーザーがスマートデバイスを起動していなくても通知を送ることができる仕組みであり、以下の特徴があります。開くと直接アプリを起動するためアクションにつながりやすいアプリをインストールしているユーザーのみに届くため開封率が高い上記のような特徴から、プッシュ通知は以下の用途で使うことが多くなります。リアルタイムな情報配信直接アプリ起動につながるため、ニュースなどリアルタイム性の高い情報の配信に向くユーザーのアクティブ率向上開封率が高いため、定期的にアプリを

shufo 2014/12/19

リンク

ジェイアール東日本情報システムが「HP Moonshot」採用

日本ヒューレット・パッカード（日本HP）は11月21日、JR東日本グループの業務システム開発／運用を担当するジェイアール東日本情報システム（JEIS）が、障害情報を一元化／共有するナレッジベース「障害情報システム」のプラットフォームとして超高密度サーバー「HP Moonshot System」を採用したことを発表した。 JEISは、JR東日本グループ約70社を中心に業務システムの提案、開発、運用を手がけており、鉄道、新幹線、Suica、生活サービスなど、システム数は主要なものだけで200を超える。これら全システムのサービス品質を改善していく取り組みの一環として、JEISではシステム障害の解決までのプロセスを記録し、ナレッジベースとして全社で活用する「障害情報システム」の新規構築を進めてきた。今回、ラックスペース、消費電力、ハイパーバイザにかかるリソースを削減するため、超高密度、超低消費電

shufo 2014/12/11

リンク

ドリコムの開発を支えるGitリポジトリ - gussan

はじめにこれはドリコム Advent Calendar 2014 の5日目です。 4日目は、@ka_nipan さんによるドリコムを支えるデータ分析基盤です。自己紹介 @gussan ドリコム歴は10年になります。アーキテクチャ設計、ミドルウェア・ライブラリ及び社内ツールの開発運用等を担当しています。本日の話 2年前の12月、メインのソースコードリポジトリをSubversionからGitLabへ移行しました。本日はGitLabへの移行と運用の話をします。 GitLabに決めた理由選択肢としてはGitLab, GH:E, Stash等がありました。メインの機能はどれも十分な機能を有していましたが、 GitLabを選んだ主な理由としては以下の3つです。継続的にメンテナンス・リリースがなされている社内にある技術で運用可能である(Rails, MySQL, Redis) も

shufo 2014/12/05

リンク

サービスを支えるプライベートクラウド基盤 OpenStack の舞台裏 | GREE Engineering

こんにちは！インフラストラクチャ本部の松橋です。このエントリは GREE Advent Calendar 2014 3日目の記事です。本日より 2日間 OpenStack の記事がつづきます。私からは、グリーのサービスを支えるプライベートクラウド基盤として OpenStack を導入し、運用、改善を続けてきた日々の奮闘についてご紹介させていただきます。振り返ればちょうど 2年前のクリスマスシーズンに本腰を入れて仕掛かり、今では運用も安定してきたので良い節目でもあります。読者のみなさまの一助となる知見が少しでも提供できれば幸いです。はじめにパブリッククラウドの台頭により、オンプレミスを基盤にサービスを展開してきたグリーにおいてもクラウドが有用な選択肢となるなかで、運用ノウハウが蓄積されたオンプレミスの資産を活用してインフラストラクチャを最適化するニーズもまた高まりました。サーバー仮想

shufo 2014/12/04

リンク

「チケット駆動のサーバ/インフラ運用における問題点と手動作業の自動化」の資料のリンク - プログラマの思索

小川明彦, 阪井誠 : チケット駆動開発日本のソフトウェア開発の現場で生み出された「チケット駆動開発」という概念を、数多くの実例を元にモデル化・体系化を試みた最初の本。小川明彦, 阪井誠 : Redmineによるタスクマネジメント実践技法 Redmineによるチケット駆動開発の実践技法に関する最初の本。アジャイルなソフトウェア開発への適用方法、TestLinkによるテスト管理手法についても言及。清水吉男: 「派生開発」を成功させるプロセス改善の技術と極意組込システム開発をベースとして、ソフトウェア開発特有のスタイルである派生開発、特にXDDPについて解説した世界でも稀な本。既存製品を保守するのではなく継続的に機能追加していく昨今の開発では、派生開発特有の問題を意識しなければならない。XDDPはプロセス論だけでなく、要件定義などの上流工程の品質改善にも役立つので注意。 Le

shufo 2014/11/25

リンク

Pinterestをスケールさせる中で学んだこと - ワザノバ | wazanova

https://www.youtube.com/watch?v=jQNCuD_hxdQ 1 comment | 0 points | by WazanovaNews ■ comment by Jshiike | 約3時間前 PinterestのMarty Weinerによる goto; conference 2014の講演。「webサイトどうやってつくるの？」という創業期から、現在に至るまで、段階的にテクノロジースタックがどう進化したか。現在のPinterestのシステムアーキテクチャの全貌。個別のテクノロジーの選択理由。などを語った45分のビデオですが、goto; conferenceのサイトからスライドのPDFをダウンロード（初日の10:20のコマです。）できるので、そちらを見ていただいてもわかりやすいかと。「サイトが落ちてしまうのである意味自然に学ぶことができてしまった。

shufo 2014/10/27

リンク

徹底比較！運用監視を自動化するオープンソースソフトウェア10製品の特徴、メリット・デメリットをひとまとめ

徹底比較！運用監視を自動化するオープンソースソフトウェア10製品の特徴、メリット・デメリットをひとまとめ：特集：運用自動化ツールで実現する、クラウド時代の運用スタイル（2）（1/12 ページ）運用自動化のポイントを深掘りする本特集。今回は「個々の作業項目の自動化」に焦点を当て、「Zabbix」「JobScheduler」「Sensu」など、運用・監視系の主要OSS、10種類の特徴、使い方などを徹底解説する。前回は、運用自動化が多くの一般企業に浸透しつつある現状と、運用自動化ツールの導入・活用のステップを紹介した。ポイントとなるのは、サーバー監視、ネットワーク監視といった「個々の運用管理作業の自動化」と、それらをつなぎ合わせた「個々の運用管理作業を連携させた自動化」の実現だ。今回はこの第一ステップとなる「個々の運用管理作業の自動化」に焦点を当て、多くの企業の注目を集めている、10種類の

shufo 2014/10/08

リンク

ご注文は監視自動化ですか？

『ご注文は監視自動化ですか？』 Serf と Consul を使って運用を楽しくする話 Serf とか Consul とか聞くけど、イマイチわからん！という疑問はありませんか。どのような働きをするのかや、使いどころを、皆さんと共有したいなと思っています。 1. はじめに 2. 基本編・ Serf ・ Consul ・ envconsul 3. 実践編・ API 連携 4. まとめ July Tech Festa 2014 June 22, 2014, @ AITT Shinagawa, Tokyo, Japan #techfesta #jtf2014 Read less

shufo 2014/06/23

リンク

Zabbixで10,000台のサーバーを監視する

Linux/OSS関連のエンジニアです。OSS監視ツールZabbixの日本支社、Zabbix Japanの代表も務めています。 Zabbixは重い！というツイートや情報があったりするのですが、海外ユーザーのサポート経験からZabbixのパフォーマンスは驚くほど良くなっていると思っていて、どこに違いがあるのか不思議に思っていたりします。 Zabbix社で大規模システムというと、監視対象が数千台規模以上、1秒あたりの監視項目数(Zabbixのダッシュボードやレポートメニューから見れる値、以降nvpsと書きます)が1000を超えるくらいからです。本社ではこのnvpsの値が1万に到達しようとしているユーザーをサポートしています。海外のZabbixサポートユーザーはボトルネックになっている点についてZabbix本体に修正要望を出し、Zabbix本体のパフォーマンスを上げつつ監視規模を拡大していって

shufo 2013/11/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (30)

運用に関するshufoのブックマーク (23)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス