タグ

運用に関するshin-uemonのブックマーク (21)

  • 満足せる豚。眠たげなポチ。:大規模サービスの運用事例まとめ

    ここ数年の大規模サービスのシステム運用について調べてみたので参照したページやファイル、へのリンクをまとめておく。PDF へのリンクも多数含まれているのでご注意を。 時代が時代なら企業のノウハウとして隠されていたような情報がこれだけ公開してもらえているというのが非常にありがたい。公開してくれている各企業や公開してくれている人に感謝。 あとで気付いたが、Google や Facebook の事例も探しておけばよかった。Thrift とかあったのに。「こんな情報もあったよ」などあればぜひ教えてください。追記していきます。 youtube http://d.hatena.ne.jp/stanaka/20070427/1177651323 digg http://d.hatena.ne.jp/stanaka/20070427/1177651323 livedoor http://labs.cybo

  • Data Pumpを使った論理バックアップの実践

    主な内容 --Page 1-- ▼Data Pump Export/Importユーティリティで論理バックアップ --Page 2-- ▼論理バックアップ処理を一時停止する --Page 3-- ▼ダンプ・ファイル・セットの使用ディスク容量を見積もる ▼データファイル、表領域、スキーマを変更してリカバリを行う ▼アンロード/ロード処理のパラレル実行 ▼覚えておくと便利なパラメータ一覧 第3回「Oracleの代表的なバックアップ方法」、第4回「Recovery Managerを使ったバックアップ方法」では、Oracleの代表的なバックアップ方法の概要について説明してきました。今回は、第3回で説明した論理バックアップ方法としてDataPumpに焦点を当て、具体的な使用方法やその際の注意点を説明します。 Data Pump Export/Importユーティリティで論理バックアップ Oracle

    Data Pumpを使った論理バックアップの実践
  • プロとしてのバックアップ/リカバリ基礎知識(1/4) - @IT

    主な内容 --Page 1-- ▼バックアップを取るだけでは不完全 ▼バックアップの主な役割 --Page 2-- ▼バックアップ計画の立て方 ▼バックアップ要件 --Page 3-- ▼バックアップ対象を決定する ▼いつバックアップを取得するのかを決定する --Page 4-- ▼バックアップ方法を決定する ▼バックアップの保持期間と取得先媒体を決定する 今回から始まる連載では、Oracleデータベースのバックアップ/リカバリについて説明します。バックアップ/リカバリの重要性、そして実際の実行方法を理解していただければ幸いです。第1回では、まず概要を理解していただくため、Oracleデータベースに限定せずに、ごく一般的な例を挙げて説明します。 バックアップを取るだけでは不完全 もし、皆さんがいま使っているパソコンのハードディスクが、急に壊れてしまったとしたら、どうしますか? 「仕事が何

    プロとしてのバックアップ/リカバリ基礎知識(1/4) - @IT
  • ウノウラボ Unoh Labs: yumのローカルミラーリポジトリを構築する方法

    naoya です。 フォト蔵などのサービスは、社内にあるサーバ群で運用しています。現在、サービスの規模が成長するにつれて、サーバの台数も約20台強くらいになってきました。 すべてのサーバには、Fedora Core 5がインストールされていて、すべてのサーバにまったく同じパッケージがインストールされています。パッケージの更新には、Fedora Core 5に付属しているyumを使ってすべてのサーバを定期的に更新をしているのですが、yum-fastestmirrorをインストールしている状態でもパッケージの更新に時間がかかるようなってきました。 そこで、一台のサーバにyumのローカルミラーリポジトリを構築してパッケージのダウンロード時間を減らしてみました。今日は、yumのローカルミラーリポジトリを構築する手順を紹介します。 1.必要なパッケージのインストール yum-utilsとcreate

  • とあるはてな社員の日記 - まっさらなサーバを30分で本番投入できるようにする

    すこし前にはてなスターのリリースがされたのですが、サービス開始直後にありがちなことに、時々負荷で遅くなったり、アクセスしにくくなったりしてしまいました*1。これではいけない、ということで、すぐ次の日に、バックエンドのサーバを一気に10台近くまで増やして、おおむね快適に使える状態になっていると思います。この時に、新しいサーバをまっさらな状態から、だいたい30分程度で番投入することができていました。これを、どのように実現したのかを軽く紹介したいと思います。 ちなみに、サービスの重さは、サーバ増強だけで済むものではなく、それ以降も、Javascriptが重い!とか、アプリケーションロジックで重いSQL を走らせてしまって遅いという問題は何回かありました。が、そこはインフラではなく、アプリケーションの問題で、アプリケーションの改善は、継続的に進んでいると思います。ので、今回は、インフラの話に限定

    とあるはてな社員の日記 - まっさらなサーバを30分で本番投入できるようにする
  • サーバやPCのボトルネック箇所の簡単な見分け方(Linux編):佐野裕のサーバ管理者日記:ITpro

    前回はWindowsでのサーバやPCのボトルネック箇所の簡単な見分け方をご紹介させていただきましたが、要望がありましたので今回はLinuxの場合をご紹介いたします。 4つの主要ボトルネック要素の復習です。 サーバやPCには4つの主要ボトルネック要素があります。このいずれかがボトルネックとなった場合システム全体のレスポンスが低下します。 CPU使用率 メモリ使用量 ディスクI/O TCPコネクション数 Linuxにおいてはボトルネック箇所を以下のように見分けることができます。 1. CPU使用率 CPU使用率が常に100%に近い場合はCPUがボトルネックであることが判明します。CPU使用状況を簡単に調べるには3つの方法があります。「top」「w」「vmstat」コマンドを使う方法です。 -----------------------------------------------------

    サーバやPCのボトルネック箇所の簡単な見分け方(Linux編):佐野裕のサーバ管理者日記:ITpro
  • cyano: mod_expiresとmod_rewriteを使ってサイトの帯域節約と体感速度を向上させる方法

    普通の帯域節約術としては、mod_deflateでdeflate圧縮するとか、CSSやJSファイルのHTTPレスポンスヘッダにLast-ModifiedやEtagを追加しておいて、ブラウザがHTTPリクエストヘッダにIf-Modified-SinceやIf-None-Matchを付加するようにし、コンテンツが変更されていなかったら304 Not Modifiedを返すという方法を取るかと思います。 しかし、HTTPサーバーはコンテンツの数だけ304 Not Modifiedを返さないといけないため、その分帯域を消費しますし、またCSSや画像などのパーツの304 Not Modifiedが返ってくるまで、そのパーツのレンダリングが行えないという問題があります(つまり体感速度に影響します)。 今回紹介するのはExpiresヘッダやCache-Control: max-age=31536000を

  • Stray Penguin - Linux Memo (PostgreSQL)

    表記について 以下の設定は、基的に PostgreSQL 7.3.0以上であることが前提。 SQLコマンドでは、変数以外では大文字小文字の区別が無いが、慣例に倣い大文字を使用することにする。 PostgreSQLを扱おうとすると、システム上のユーザおよびパスワードと、PostgreSQL上のユーザとパスワードが出てくることになる。混乱を防ぐため、システムユーザの世界は通常色、PostgreSQL上の世界は赤で表記している。 Table of Contents インストール 設定 postgresql.conf pg_hba.conf pg_ident.conf ユーザとデータベースの作成 手続き言語の組み込み psqlターミナルの基 データベースのダンプとリストア データベースのダンプ データベースのリストア pg_dumpallを使った一斉ダンプ&リストア 運用のTips (オブジェ

    shin-uemon
    shin-uemon 2007/06/08
    わかりやすい
  • 電子カルテ「運用」のためのブログ

    サーバ更新からもう2年経過しました。 更新と前後して、新しい事業にとりくんでいたため、しばらくぶりに訪れたら、あらまあ・・・ 1万近いコメント・トラックバックスパムが・・・、放置して埃かぶった別荘に来た感じで一生懸命掃除しました。 きちんと管理しないとこういうことになるんだと、あらためて痛感したところです。 ぼちぼち、新しい事業のことも、電子カルテの運用のことも書いていこうと思ってます。 先日、久しぶりに見学の方がいらっしゃいました。 電子カルテ稼働院所が増えたためか最近は見学の受け入れも少なかったのです。 その病院では、当院と同じオーダリングシステムを導入されていて、電子カルテシステムを稼働させたいと考えて、見学の運びとなったようです。 同じシステムなので、オーダのイメージも同じだし・・・と思いながら運用を聞いてみると、投薬オーダのみの稼働という実態でした。 同じシステムでなぜと思われる

    電子カルテ「運用」のためのブログ
  • TAKESAKO @ Yet another Cybozu Labs: ニコニコ動画勉強会に行ってきました

    日ドワンゴさんの会議室にてこっそり開催されたニコニコ動画勉強会に参加してきました。 日の動画コメントサービス「ニコニコ動画」の裏側をドワンゴの開発者の方から 直接お話しを聞いて、参加者も一緒に意見交換ができる非常に面白い勉強会でした。 ドワンゴさんとしては会社で行なう技術者向けの勉強会初めての試みということもあり、 まずは開発者の知り合いベースで声をかけあって少人数で開催することにしたそうです。 六木のクラブの人や、バイナリカンファレンスでご一緒した人とこんなところで お会いできるとは思っていませんで、さまに想定の範囲外でした。 その甲斐あって密度の濃い話ができたと思います。 以下、自分用のメモを公開できる範囲で書きます。間違っていたらすみません。(ご指摘いただければすぐに訂正します) ■ニコニコ動画の苦労話 (Sさん) ニコニコ動画の歴史 2006年10月 一人でプロトタイプを開発

  • Twitterのトラブルから見る、DB分割でスケーラブルなRailsサイト構築:TKMR.blog.show

    最近、2.0な方々の間でTwitterが話題になってる。で、そのTwitter自体も面白いんだけど、TwitterについてDHHがブログを書いてRailsでの大規模サイト構築が話題になってるのが面白い。 Twitter trouble (Loud Thinking - DHH) まずTwitterの高負荷について言及、Twitterは11,000リクエスト/秒 の高負荷で問題となっているらしい。 そしてスケーラビリティの鍵はDB分割だ、と言っている。Railsは基一つのDBを見るのでスケーラビリティの問題になる (確かにWebサーバはロードバランサがあればいくらでもスケールするしね、Sessionの共有だけ気を付ければ) ↓ Dr Nic » Magic Multi-Connections: A “facility in Rails to talk to more than o

  • Ubuntu、Symfony、Lighttpdを使ってスケールするWeb 2.0サイトを構築する - PHPプロ!ニュース

    平素より「PHPプロ!」をご愛顧いただき、誠にありがとうございます。 2006年より運営してまいりました「PHPプロ!」ですが、サービスの利用状況を鑑みまして、2018年9月25日(火曜日)をもちましてサービスを終了させていただくことになりました。 サービス終了に伴いまして、2018年8月28日(火曜日)を持ちまして、新規会員登録ならびにQ&A掲示板への新たな質問、回答の投稿を停止させていただきます。 なお、ご登録いただいた皆様の個人情報につきましては、サービス終了後、弊社が責任をもって消去いたします。 これまで多くの皆様にご利用をいただきまして、誠にありがとうございました。 サービス終了に伴い、皆様にはご不便をおかけいたしますこと、心よりお詫び申し上げます。 件に関するお問い合わせはこちらよりお願いいたします。

  • プレスリリース配信「ValuePress」の運営元バリュープレス社に迫る

    GIGAZINEはいろいろなプレスリリースをメーカーなどからも配信してもらっているわけですが、世の中にはこういうプレスリリースを配信することを仕事にしている企業も多々あるわけです。 今回取り上げる「ValuePress!」はマスコミ向けプレスリリース配信代行サービスであり、通常のプレスリリース配信と違って、記者が実際にそのプレスリリースを読んでくれたかどうかを計測可能で、なおかつメール配信登録をしなくてもRSSで新着リリースを提供していたり、いろいろと積極的な展開も行っています。 で、その運営元である「株式会社バリュープレス」(旧社名グローバル・フレックス・プランニング 2006年11月より社名変更)は仕事の内容によってRPGのように経験値やアイテムが表示されるという面白い社内システムを持っており、今回はそのあたりを含めてインタビューしてきました。 ◆バリュープレスってどんな会社? オフィ

    プレスリリース配信「ValuePress」の運営元バリュープレス社に迫る
  • Webアプリの問題点を「見える化」する7つ道具

    Webアプリの問題点を「見える化」する7つ道具:現場から学ぶWebアプリ開発のトラブルハック(1)(2/3 ページ) その2:負荷生成ツール 負荷生成ツールは、Webサーバなどに対して複数のユーザーからの同時アクセスによる負荷を疑似的に発生させるツールである。 ■使いどころ パフォーマンスに問題がないかどうか確認したり、性能劣化などの現象が発生した場合、その現象を再現させるために利用する。Webシステムのトラブルやパフォーマンスの問題は、クライアントからのリクエストを大量に処理しているときに起こるものが多い。 例えば、10秒以内にユーザーが50人程度ログインしたときにシステムが無応答になる現象が発生している場合、再現を行うために人手でブラウザを操作するのは非現実的である。負荷ツールを利用すれば、何十、何百人分の負荷を簡単に発生させられる。 ■分析方法 負荷生成ツールの基的な使い方は、負荷

    Webアプリの問題点を「見える化」する7つ道具
  • Webアプリの問題点を「見える化」する7つ道具 (1/3) - @IT

    今回の概要 システムが応答しない、パフォーマンスが劣化したなどのトラブルが発生したときに、原因がなかなか掴めず、あたふたすることはないだろうか? 稿では、Java EEトラブルシューティングの現場で役立つ7つ道具を紹介する ある日、突然電話が鳴る 用件は、「システムが不定期に停止する。よく分からないけど、どうやらJava EE部分がおかしい」とのこと。このような事態が発生したとき、やみくもに原因を調べ、いつまでたっても問題が解決できず、原因の一片も発見できないことが多々ある。 トラブルが発生した場合、ツールが充実していない昔は、開発者の経験と勘に頼るところが非常に大きかった。Webシステムが普及するいま、昔とは比べ物にならないほど、システムの数が増え、開発者数が増える一方、システム障害を切り分けられる職人的なエンジニアの人数はシステム数に比例して増えているわけではない。そのため、すべての

    Webアプリの問題点を「見える化」する7つ道具 (1/3) - @IT
  • The Linux Foundation Japan - OSSミドルウェア/ツール調査

    The Linux Foundation Japan リナックスファウンデーション・ジャパン The Linux Foundationは、Linux® の普及、保護、標準化を推進する非営利のコンソーシアムです。 SI Forum OSSミドルウェア/ツール調査 調査は、2006年9月〜2007年2月にかけ、SI Forumに参加しているベンダ・SIerメンバーの協力によって行われました。 各社の中でも、とりわけLinux/OSSの企業システムへの適用の最前線に立つ皆様のご協力を得て、今時点のLinux/OSSの状況を捉えることができました。 皆様のご意見、さらなるOSS情報の提供をお願いいたします。 ※2007年度活動の一環で内容を見直し、ライセンス情報を追加してデータベース化しました。最新情報については、各SIプロセスで使用できるOSSツールページでデータベースを"

  • ウノウラボ Unoh Labs: 専用サーバを構築するときにまず行う4つの設定

    こんばんは、最近寒い夜が続いていて自転車通勤がつらくなってきた naoya です。 ウノウでは、フォト蔵や社内システムなどは、すべて専用サーバを構築して運用をしています。 今日は、専用サーバを構築するときに、僕がウノウで学んだ専用サーバでまず行う4つの設定を紹介します。 なお、今回の設定はすべて Fedora Core 5 をもとにしています。 (1) sudo を使えるようにする sudo コマンドを使えるようにします。sudo コマンドは、別のユーザとしてコマンドを実行できるコマンドです。 sudo コマンドを使えるようにするには、/etc/sudoers に sudo を許可するグループを追加します。次の例は、unoh グループを追加する例です。 %unoh ALL = (ALL) ALL, !/bin/su, /bin/su postgres, /bin/su * postgres

  • さくらインターネット移行記#2 VPN越しのMySQLレプリケーション

    前回さくらiDCに移転し始めた、ということを書いたのですが、あれから一ヶ月ちょっとが経過しましてその後も順調に iDC への移転が進んでいます。すでにラックもいくつか借りて、サーバーも数十台がさくら iDC で稼動しています。回線がこれまでよりも高速なバックボーンに接続されつつ、帯域幅も大きくなったことから、移転したサービスによってはこれまでよりもパフォーマンスが出ているサービスもあります。うち比較的大きなデータを扱うフォトライフも移転を完了していますが、おかげさまで画像の読み出しがかなり速くなったのが体感できるぐらいスループットが向上しました。 既存サービスを移転するにあたって、どういった構成でそれを行っているかをちょっと紹介してみようと思います。 移転当初は、既存のはてなのサービスとはあまり関係していないサーバー群から手を付けました。例えば広告のシステムといった、はてなのデータベースを

    さくらインターネット移行記#2 VPN越しのMySQLレプリケーション
  • DSAS開発者の部屋:パソコン1台ではじめるロードバランサ体験

    昨日書いたの通り,記事を寄稿したWEB+DB PRESS Vol.37が,今日発売になりました.それを記念して(?),記事の内容が簡単に実験できるパッケージを公開します. これは,VMWareを使って,だれでも直ぐにロードバランサの実験を始められるパッケージになっています.何台もマシンを集めたり,Linux をインストールする必要は一切ありません.無償配布されているVMWare Playerがあれば,いつでもどこでも実験ができます. もちろん,このブログで去年の夏に公開した4つのエントリ こんなに簡単! Linuxでロードバランサ (1) こんなに簡単! Linuxでロードバランサ (2) こんなに簡単! Linuxでロードバランサ (3) 高トラフィックに対応できるLinuxロードバランサを目指して〜LVSをNATからDSRへ の実験もできます. ダウンロードはこちらからどうぞ(75MB

    DSAS開発者の部屋:パソコン1台ではじめるロードバランサ体験
  • サーバにDoS耐性を付ける - stanaka's blog

    ウェブサービスでは、アクセスが集中して、サイトが落ちる、というのは、よくある話です。純粋に人気が出てアクセス集中するなら、サーバ管理側の責任と言われても、しかたないと思います。しかし、botやF5アタックによる突発的な集中アクセスで、落ちてしまう、というのは、運営側としても、あまり納得がいくものではありません。 そのような突発的なアクセスに対応するために、大量のアクセスをしてくるクライアントを検出し、優先度を落すか、アクセス禁止にする方法などがあります。 というわけで、Apacheモジュールでそれを検出するためのmod_dosdetectorを開発しました。(ちなみにコア部分の開発期間は、Apacheモジュールって、どう書くんだっけ、という状態から、3日でした。) mod_dosdetectorは、Apacheモジュールとして動作し、クライアントのIPアドレスごとにアクセス頻度を測定し、設

    サーバにDoS耐性を付ける - stanaka's blog