タグ

サーバ管理に関するsarface2012のブックマーク (38)

  • サーバのトラブルシューティングにsysdigが使えそう - $web->{note};

    sysdig とは? Sysdig is open source, system-level exploration: capture system state and activity from a running Linux instance, then save, filter and analyze. Think of it as strace + tcpdump + lsof + awesome sauce. With a little Lua cherry on top. http://www.sysdig.org/ 上に書いてある通り、一言で言うと strace + tcpdump + lsof + α。tcpdumpのように-wで書き出して-rで読み込めるのがありがたい。 高機能過ぎてまだ全然使いこなせてないけど、ぱっと触った感じ使えそうだなと思ったものを紹介。 1. プロ

    サーバのトラブルシューティングにsysdigが使えそう - $web->{note};
  • 完璧な監視システムの作り方 in cybozu.com - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちは、Hazama チームの萩原(@hagifoo)です。 ハードウェアは故障し、ソフトウェアにはバグがあり、運用ではミスがおきるもの。もちろん、障害が発生しないのが理想ですが人間が作ったものに完璧はありません。そこで、障害の前兆や発生を捉え、その詳細を運用チームに知らせるための監視システムが必要となります。cybozu.com でも以下のようにありとあらゆるものを監視するシステムを構築し日夜監視を行なっています。 今回は、そんな cybozu.com の監視(モニタリング)システムについてお話しします。 cybozu.com と障害 監視システムの設計 3つの監視 外形監視 症状監視・リソース監視 ログ監視 その他の監視 モニタリングフレームワーク 誰が監視者を監視するのか? まとめ cybozu.com と障害 まずは、監視対象である cybzou.com について説明します。

    完璧な監視システムの作り方 in cybozu.com - Cybozu Inside Out | サイボウズエンジニアのブログ
  • 今日から業務で使える17の運用系Linuxツール、そして円環の理

    運用系ツールのつもりが、新人さんに伝えたい「円環の理」資料になってしまいました。 “qpstudy 2013.04”の @zembutsu LT 発表資料です 『qpstudy3周年記念LT大会 〜新人さん、業界にようこそ!〜 with ビール』 http://www.zusaar.com/event/613004� 共有したかった事 ・2013年、這い寄る混沌・ガラケーは衰退しました ・基コマンドの連携は必須 ・時系列リソース監視が鍵 ・仲間達と協力する心も大切Read less

    今日から業務で使える17の運用系Linuxツール、そして円環の理
  • ChefでCookbookを作成するときのちょっとしたコツ 9選 - インフラエンジニアway - powered by HEARTBEATS

    こんにちは。斎藤です。 Chefで構築の自動化ができる事はわかっていても、Cookbookをどう記述すればいいのかピンとこない場合があります。そんなときに使えそうなコツをピックアップしてみました。 「Chefを使ってみたいけどいまいちとっかかりがわかりづらい」「あれ、これはどうやるんだ?」、そんなときにご覧頂けたら幸いです。 ※Chef 10.16.2で確認しました。また、RHEL, CentOSで利用する事を前提に説明しています。 Cookbookに同梱したRPMファイルから直接インストールする cookbook_fileとpackageリソースを組み合わせて実行します。 下記の例は、MySQLサーバをRPMファイルを用いてインストールします。 "MySQL-server-5.5.29-1.el6.x86_64.rpm"ファイルをあらかじめ "files/default" 内に保存します

  • キャパシティプランニング 発表資料 | 外道父の匠

    久々に社内向けに勉強会を行いました。 既に稼働しているサービスの、サーバの台数調整の考え方についてです。半分くらいは口頭で話したので資料だけでは物足りないかと思います。が、せっかくなので公開しておきます。 内容はインフラ管理についてですが、対象者はどちらかというとアプリケーションエンジニアとして作成・発表しました。資料と、ブログ用に補足を書いていきます。 作りやすくて頼りになるので、 もう、赤さんはテンプレでいいかな、とも思い始めました。 補足 勉強会をするに至った理由 いわゆるインフラエンジニアが、サーバの負荷状態を観測したり、台数を判断できるのはアタリマエですが、サービスを作成しているアプリケーションエンジニアにとってはアタリマエではなかったりします。 理想としては、WEBエンジニアたるもの、自宅サーバやレンタルサーバを1つは持っていて 総合的な知識を得ようとする環境・努力をして欲しい

    キャパシティプランニング 発表資料 | 外道父の匠
  • 僕らが日々使っているproteus-monitorが公開されています+インストール方法 - oranie's blog

    詳しいアーキテクチャなどは今後おいおい・・・なんですが、とりあえず公開されていますよ、という紹介記事です。自分たちで使っているので言うのも何ですが、非常に素晴らしいツールで是非良かったら試してみて欲しいです。 何をするツールなのかというと、agent側で値を取って来てserver側でWeb画面表示させる、という書いてしまえば「ふーん」な感じなんですが、現在これでdstatの値等を取ってきて可視化しています。こんな感じです。とてもシャレオツです。 で、1台や2台だとあんまり威力が分からないかもですが、これが数十台や数百台の運用になってくると ・わざわざサーバにログインして見るとかリームー ・cactiやmuninもポーリングしている間隔で取れていないとかがあるので、「今この瞬間の全サーバの状況が知りたい!」という「おやじの全盛期は全日の時か・・・オレは・・・オレは今なんだよ!」というのに向

    僕らが日々使っているproteus-monitorが公開されています+インストール方法 - oranie's blog
  • 原因調査用Linuxコマンド | 外道父の匠

    サーバの動作に異常が発生した際に原因を探るためのLinuxコマンドで、自分用のメモです。 全てmanとかググったら出てくるので説明は適当です。思いついたら後で追記していくかもです。 対象はDebian Squeezeになります。 全てパッケージインストールできるもので、パッケージ名は [in packagename] としてあります。 各所よりコメントありがとうございます。 良さ気なコマンドは追記していきます。 <追加したコマンド> * telnet (+コメント wget, netcat) * arp (+コメント arpwatch) * pstree * fdisk コメントに gdisk * host, dig * watch * reboot

    原因調査用Linuxコマンド | 外道父の匠
  • サーバ管理の仕組みを作り始めた話 - Kentaro Kuribayashi's blog

    先日(10/9)、riywoさんさんの呼びかけにより、サーバ管理をどうやったらいい感じなるかを話し合う会がもたれました。僕は、直接サーバ管理をやっているわけではないのですが、社内でそういうの欲しいという話をしていて、ツールを作りたいといっていたので、参考になればというわけで、お誘いいただいて参加してきたのでした。 riywoさんから、叩き台としてホストのキーを元にした統合的なAPIの構想を図式化したスライドを提示していただいた後、管理システムの主なユースケースや、各社の実際の管理手法などをいろいろお話をうかがいました。僕など、インフラ的な知識に乏しいもので、これはなかなか大変なことだなあというのがあらためてわかりました。 組織体制や経理ルールの複雑性が各社でだいぶ違う サーバの情報として必要な属性が各社でだいぶ違う そもそもサーバの情報が複雑 既にあるなんらかの管理の仕組みとの整合性を取る

    サーバ管理の仕組みを作り始めた話 - Kentaro Kuribayashi's blog
  • NTP設定 - とあるSIerの憂鬱

    環境 RHEL5 ( ntp-4.2.2p1 ) RHEL6 ( ntp-4.2.4p8 ) NTPは結構微妙な修正を入れてくるのでバージョンが異なる場合は注意が必要。 manが当該バージョンの情報源としてはまず優先。 最近の変更 RHEL6ではRHEL5で /etc/init.d/ntpd のみで行っていたことを /etc/init.d/ntpdate と /etc/init.d/ntpd に分離している。 ntpd起動前のntpdate実行について分離している。ntpdを使うのであればntpdateも同時に有効にするべき(ntpdate実行を避けたい場合以外)。 設計 何もよりも先に 『参考』にあげた富士通の『Linuxユーザーズマニュアル RHEL6編』がNTPの説明として詳しい・わかりやすい。まずはこれを読む。 NTPサーバの階層設計 NTPを使う目的は『正しい時刻の維持』と『時刻

    NTP設定 - とあるSIerの憂鬱
  • アプリケーション環境構築の自動化をまじめに考えてみる(1) - めもめも

    2012/09/16 追記 記事で紹介しているツール「virt-construct.py」は、記事の公開後にもろもろアップデートしています。最新バージョンについては、こちらの記事を参照してください。 師宣わく 「環境管理の鍵は環境構築を完全に自動化されたプロセスで行うことにある。環境を新しく作るほうが古い環境を直すよりも常に安上がりであるべきなのだ。」 ---『継続的デリバリー』 Jez Humble, David Farley. すばらしい。当にこれが実現できれば、作りに作りこんだ仮想マシンの巨大なディスクイメージファイルを後生大事に貯めこむ必要はもうなくなります。誰かが勝手に設定変更して動かなくなったサーバを前に呪いの言葉を吐き続けることもなくなります。 IaaSが普及して、OS環境は5分で用意できるようになりましたが、その上のアプケーション環境を今までどおりに手作業で構築、メン

    アプリケーション環境構築の自動化をまじめに考えてみる(1) - めもめも
  • iPXE導入でサーバ機種にあわせたネットブートを : DSAS開発者の部屋

    さて、 前回は、iPXEを利用してサーバの機種情報等から動的にパラメータを生成してLinuxを起動する方法を簡単に紹介しました。 今回は、syslinuxのmenu.c32を利用した起動メニューの利用と機種情報によって動的にメニュー設定を変更する方法を紹介していきたいと思います。 (タイトルはそれらしいのにかえてみました(^^;;) 起動メニューを利用するには DSASでは、PXELINUX+menu.c32を利用して起動時に使用するカーネルやイメージを選択できるようにしており、OSの起動中や起動後に使用する変数などをカーネルパラメータに記述したりしています。 状況によっては、起動時にパラメータを追加したり変更して起動したいケースがあるのですが、前回も書いたように、iPXEに用意されているメニューコマンドを使って作成したメニューでは、起動時にメニューを手動で変更することは現時点では難しいよ

    iPXE導入でサーバ機種にあわせたネットブートを : DSAS開発者の部屋
  • ロードアベレージを監視して任意のコマンドを実行するコマンド - blog.nomadscafe.jp

    とあるサーバでロードアベレージが上がったときに何が起きているか知りたくなったので書いてみました。他に似たツールがあれば教えて欲しいです cpan: https://metacpan.org/release/App-LoadWatcher github: https://github.com/kazeburo/App-LoadWatcher インストール インストールはcpanmを使います $ cpanm App::LoadWatcher cpanmが入っていないなら $ curl -L http://cpanmin.us/ | perl - App::LoadWatcher とすると楽です 使い方 ロードアベレージが「0.6」以上のときにuptimeを表示するには $ load_watcher -l 0.6 -- uptime こんな感じです。ハイフン2つ書いたあとにコマンドを書きます オ

  • Automation Tech Casual Talks #1に参加してきました

    まだローンチ前なので構築していない妄想の部分もあります。 自分のメモ & まとめは下記の通り AWSを使う場合は、開発力が必要。ペパボではwrapper等結構開発している感じjenkinsの使い道はtestだけじゃない。(Gemfileのcommitをフックにして、systemで使うrubyをtar ballに固める、サーバーリストからdeploy)appのrubyとsystem rubyは分けて管理 systemrubyにはresqueやfluentdのpluginとかを含めておき、tar ball化して管理system ruby は rbenvで管理 & /usr/local/rbenv/配下に置くサーバーが複数台になった時点でyumレポジトリ立てた方がよいMySQLのserver-id はIPアドレスでOK ipaddress[/\d+.\d+.\d+$/].gsub(/./, “

    Automation Tech Casual Talks #1に参加してきました
  • Test::System::Config で サーバの設定をtest - うまいぼうぶろぐ

    perldoc Test::Config::System use Test::Config::System tests => 4; check_package('less', 'package less'); check_package('emacs21', 'emacs uninstalled', 1, 'rpm'); check_link('/etc/alternatives/www-browser', '/usr/bin/w3m'); check_file_contents('Test/Config/System.pm', qr/do {local \$\//); check_package dpkgかrpm packageがinstallされているか。defaultはdpkgをtest check_file_contents 指定したファイル内に指定したregexがマッチするかte

    Test::System::Config で サーバの設定をtest - うまいぼうぶろぐ
  • いい感じにサーバの構成情報を出力してくれるツール、ohaiを使ってみた - mikedaの日記

    サーバの構成情報の収集にはdmidecode、uname、/proc/*などなど、いろいろ駆使してると思うのですが 覚えるの大変・・・出力のパースめんどくさい・・・複数OS使ってる場合は特に・・・ というわけでいい感じにサーバの構成情報を出力してくれるツール、ohaiを紹介 (実はChefっていう構成管理ツールで内部的に使うためのものなのですが単体でも利用可能です) http://wiki.opscode.com/display/chef/Ohai インストール Rubyで書かれたツールなのでgemで [root@test01 ohai]# gem install ohai※うまくインストールできない場合はgemをアップデートしてください。ruby-develも必要 実行例(コマンド) ohaiコマンドを実行するとJSON形式でサーバの情報が出力されます HPサーバ上のCentOS [ro

    いい感じにサーバの構成情報を出力してくれるツール、ohaiを使ってみた - mikedaの日記
  • dstat2graphs - dstatのログをグラフ化するツール - SH2の日記

    dstatが便利ですね。 dstat が便利 | Carpe Diem dstatの万能感がハンパない - (ひ)メモ 私は特に--outputオプションでCSV形式のログファイルを出力できるところが気に入っています。番環境ではきちんとした監視ツールを使うと思いますが、開発・検証環境で手早くOSリソース情報を可視化できるので重宝しています。 それでもExcelやCalcでグラフを描くというのは何度も繰り返すと面倒なもので、 探したのですが見つからなかったので、連休を利用して作ってみました。 dstat2graphs - dbstudy.info サンプル1 (前回の負荷テストにおけるクライアントのグラフ) サンプル2 (サーバ) サンプル3 (KVMホスト) いくつか注意点があります。 dstat -tvfn --output log.csv 1しか受け付けないという割り切った作りです。

    dstat2graphs - dstatのログをグラフ化するツール - SH2の日記
  • Linux上でプロセス毎のI/Oを調査するツール piotop.pl をさらに改造

    人間とウェブの未来(旧) 「ウェブの歴史は人類の歴史の繰り返し」という観点から色々勉強しています。2014年までの人間とウェブの未来の旧ブログです。 topコマンドのように、実行中のプロセスとプロセスのreadとwriteのI/OをBpsでリアルタイムで表示するツールpiotop.plをPerlの復習がてら作ってみました。さらに、それをOpenVZやVirtuozzo+Plesk+Apacheの環境で、どのコンテナのどのドメインのどのCGIやPHPがどの程度I/Oを使っているのか、まで調べることができるようにしました。 はじめに vmstatやiostat等が個人的にはあまり見やすくないのと、Webサーバ上でトラフィックだけでなく、実際にHDDとのI/Oがどの程度なのかをプロセス単位で調べたい、というのがもともとの動機です。トラフィックが少なくても、サーバ内部で猛烈にI/Oするようなプログ

    Linux上でプロセス毎のI/Oを調査するツール piotop.pl をさらに改造
  • デブサミ2012、講演スライド資料まとめ

    翔泳社主催のソフトウェア開発者向けカンファレンス「Developers Summit 2012」(以下、デブサミ2012)が先週末に2日間かけて開催されました。ご参加いただいた皆様、ありがとうございました。現在Web上で一般公開されている講演スライドの入手先をまとめましたので、ぜひご参考ください。 2月16日(木):A会場 【16-A-1】見る前に翔べ ~ギークの工夫で社会を変えよう~ 【16-A-2】大規模ソーシャルゲーム「ドラゴンコレクション」 ~ そのシステム運用の最前線を語る! 【16-A-3】デブサミをきっかけに転職したエンジニアの歩き方 【16-A-4】Effective Smartphone UX at GREE 【16-A-5】node.jsテクノロジースタック for ソーシャルアプリケーション 【16-A-6】いまどきのi18nのはなし 【16-A-7】あの人の自分戦略

    デブサミ2012、講演スライド資料まとめ
  • 【2011年】【Webエンジニア向け】はてブ数ランキング厳選超人気記事総覧 / Devslog

    2011年も残すところあと少しになりました。2011年にはてなブックマークをたくさん集めた記事の中から、Webデベロッパー向けに限定して厳選してお届けします。 ウェブデザイン入門 ウェブサイトにおける視覚面に対し、整理・再構築・意匠等を施す。グラフィックデザイン的な要素を多く含む一方で、インタラクティブな要素を持つウェブの性格上、情報デザインあるいは工業デザイン的なスキルも求められる。ウェブサイト全体の情報設計、見た目を中心とするグラフィックデザインやGUIの設計、ウェブアプリケーションのUI設計構築など多岐に渡る。 Web制作をこれから始める人の為のスキル・HTMLCSS・ブラウザ・写真素材入手の基礎情報 WEBデザイナーを目指す人へお勧めしたい記事・サイトまとめ – YATのBlog デザイナーからデザインの基礎や原則を学べるエントリーまとめ(webデザイナ向け)*ホームページを

  • サーバの構築作業や運用管理を自動化する「Chef」 (CADC研究レポート発表LT)

    7. Chefを使って、急なサーバ増設も、 普通にこなせるようになってきました! http://www.flickr.com/photos/jonathanbeard/3307862620/ 7 8. 「Chef」とは • サーバの構築作業 システム の ール – システムのあるべき状態を設定する • オープンソース、Ruby製 • 匏用実 – 37signals – Engine Yard – Rackspace hosting – etc… http://www.flickr.com/photos/jonathanbeard/3307862620/ 8 9. サーバ構築・システム 自動化の厧勥勯 • 手作業では、そもそも時間がかかる – 数十台、数百台のレベルになると・・・ – 叓割のサーバ とに が発生したりとか サーバ匐 までのリード イムが くなることで 機会損失を発生させること

    サーバの構築作業や運用管理を自動化する「Chef」 (CADC研究レポート発表LT)