[B! 運用] keihsのブックマーク

MySQLを割と一人で300台管理する技術

14. MySQLの⾯倒を⾒る #とは DBに特化した（広義の）インフラデザインバックアップの頻度, 保管先, ..etc. + その実装- 監視, リソースモニタリング, ..etc. + その実装- mikasafabric for MySQL + MySQL Router- メジャーバージョンアップの検証とか、Percona Serverとか MariaDBとか - DBに特化したショット作業吊るしの ALTER TABLE 以外を使ったテーブル定義の更新 < 5.6 だったり、テーブルが⼤きすぎてレプリケーションが詰まったりするケース - スロークエリーチューニング- マイナーバージョンアップ- 13/63

keihs 2017/09/06

リンク

【社内資料公開】運用手順書を作る時のポイントについて書いてみた | DevelopersIO

はじめにこんにちは植木和樹＠上越妙高オフィスです。本日は私がここ10年くらい意識している運用手順書を書くときのポイントについてまとめてみました。対象読者開発・構築したシステムを別の人に引き継ぐ予定のある人他の人が作ったシステムを引き継ぐ担当の人半年後の自分でも分かる手順書の書き方に困っている人（この記事を読むのにかかる時間の目安：5分） 1. ドキュメントの冒頭に書くことまず個々の詳細手順の前に、ドキュメント自体について記載してもらいたいことです。 1.1. ドキュメントに書かれていることを3行で書くドキュメントの最初には、このドキュメントに何が書かれているのかを100文字くらいで書いておくと良いでしょう。システムが増えれば増えるほど手順書も増えていくものです。見つけたドキュメントに自分の期待するものが書かれているのか、冒頭数行でわかるようになっているとうれしいです。 1

keihs 2016/06/30

リンク

エンジニア3人で支える月間10億PV

・2年で月間10億PVを支えるまで成長した ZenClerkの運用上の工夫を紹介・AWSのTipsとあるある話の共有

keihs 2014/07/27

リンク

ヌーラボのインフラ運用最前線〜イミュータブルを目指して〜 (前編) | 株式会社ヌーラボ(Nulab inc.)

このエントリは前後編に分かれています。前編は主に運用フローやそこでの工夫点、後編は実際の運用から得た知見や今後の課題といった内容です。ヌーラボのインフラ運用最前線〜イミュータブルを目指して〜 (前編) ヌーラボのインフラ運用最前線〜イミュータブルを目指して〜 (後編) 最近はインフラ運用・DevOPS関連のトピックとして目にしないことはないくらい、「イミュータブルインフラストラクチャー」について様々な議論がなされています。私たちも昨年、継続的デリバリという文脈で、@IT の連載にてその基本的な考え方について紹介させていただきました。さて、今年の二月にローンチをしたばかりのヌーラボのシングルサインオンサービス「ヌーラボアカウント」では、イミュータブルインフラストラクチャの一歩手前として、特定の変更を加える場合のみ、ごっそり環境ごと入れ替えるというやり方にてその運用をスタートしました。

keihs 2014/04/11

リンク

JobSchedulerの機能と設定～基礎編

JobSchedulerの機能と設定～基礎編：OSS「JobScheduler」で実現するこれからの運用自動化（1）（1/2 ページ）本連載では運用管理の一要素である「バッチジョブ管理」に着目し、より効率よいバッチジョブ管理を実現するためのツールであるオープンソースの「JobScheduler」について解説します。はじめにサーバ仮想化やクラウドの浸透により、システム環境はますます複雑化しています。このような中、近年ではDevOpsに代表されるとおり、迅速にサービス提供を実施するために効率よい開発や運用を実施することが求められています。本連載では運用管理の一要素である「バッチジョブ管理」に着目し、効率よいバッチジョブ管理を実現するためのツールであるオープンソースのソフトウェア「JobScheduler」について解説します。 ※以降、本編の中で記載する「ジョブ」は「バッチ形式で実行する

keihs 2013/10/18

リンク

危なくないgitこと、うちのチームのgit戦略草案(ver. 2)

履歴恥を忍んで記事を公開させていただいたおかげで、いろいろフィードバックいただきました。フィードバックを取り込んで更新を行なっています。 2012/11/16: cherry-pickしやすいように、というくだりのところは論理通ってないので削除しました。 1 pull req. 1 commitの原則をやめました。言いたいことであった「試行錯誤の過程を入れないで」を丸パクリしました！ > id:kazuho その他表記修正、クリアコードさんの記事に説明丸投げなど。まえがき gitでトラブった！という話を何度か聞いたことがあります。なんでトラブッてるんだろう…と話を聞いたところ、同一のリモートブランチに対して複数人・複数環境から操作が行われているようです。極端な例を挙げると、masterブランチしか存在しておらず、コミットログをキレイにするためと称してgit pull –rebaseを常

keihs 2012/11/15

git
運用

リンク

「MongoDBのはじめての運用テキスト」を書いてみた - 256bitの殺人メニュー

Mongo DB使いましょって時に、やれ、レプリカセットだの、シャーディングだの、いちいち手順とか教えていくのがめんどくさくなったので、これを見たらコマンド的な手順はひと通りいけますよ。だから後は自分で調べてね、っていう資料をつくってみたのだ。というわけで、「Mongo DBのはじめての運用テキスト」SlideShareにあげました。 Mongo DBのはじめての運用テキスト from Akihiro Kuwano 内容 PDFには、以下の様な内容を盛り込んでいます。インストールレプリカセット構築シャーディング設定基本的なオペレーション Stat系ツールの見方。ただし、徐々に古い情報にはなってくると思うので、詳しい情報や、最新の情報を見たい方には公式のWikiなり、ソースなり見ていただくのを推奨いたしますｗ意図以前Mongo DBの薄い本などもあって、あれはすごくわかりやすい入門テ

keihs 2012/10/24

リンク

Nagios　×　boundioを使った鬱陶しいアラートの作り方　β

fujya.shです。はじめての人は、はじめまして！そうじゃない人はお久しぶりです。最近暑いですね。サーバールームの温度も少し上がってきたので、あぁ本当の夏がやってきたんだなと実感できる今日この頃です。今回はboundioというKDDIウェブコミュニケーションズが提供している電話APIサービスを使って少しもにょもにょしてみたいと思います。 ■アラートメールがジャンジャン来るとむしろ気づかない。じゃあ電話じゃない？運用しているサービスが増えてきたり、サーバーの台数が増えてくるとアラートメールがジャンジャンきたりしますよね？本来ならばそういった場合にアラートの原因をすぐさま対策するか、しきい値の変更を実施すれば良いのですが時間的な制約で次週へ持ち越し・・・なんて事も稀にある話です。そんな時にメールボックスがパンクしてしまい、ほんとうに大事なアラートに気付けない事もあるって話を聞いたり聞

keihs 2012/08/15

リンク

http://www.2ch-search.net/blog/3

keihs 2012/06/27

リンク

1台から500台までのMySQL運用 MySQL Beginners

5. On-Demand WorkforceWorkforce On-Demand On-Demand Workforce On-Demand Workforce On-Demand Workforce Our Service (livedoor) Amazon MechanicalAmazon Mechanical Turk Mechanical Turk Amazon Mechanical Turk Mechanical Turk Turk Amazon Amazon t/ Workers Workers Requester Requester On-Demand WorkforceWorkforce On-Demand On-Demand Workforce On-Demand Workforce On-Demand Workforce Amazon MechanicalAmazon

keihs 2012/05/30

mysql
運用

リンク

OSS統合監視ツール「Zabbix」を利用して大規模環境監視(2) - Tech-Sketch

前回の記事では、Zabbixのテンプレート機能の有効な利用方法について紹介いたしました。第2回目の今回は、「ディスカバリ機能」、「自動登録機能」を紹介したいと思います。サーバの運用管理をされている担当の方で、数十台、数百台と大量のサーバを管理されている方も多いかと思います。また、新しくサーバが追加されたり、不要になったサーバを廃棄したりと常に環境が一定であることも少ないかと思います。そういった環境の統合監視をする場合、監視の設定変更に非常に時間がかかってしまったりと運用コストが高くなってしまいます。そのような状況を少しでも解消するためにZabbixでは「ディスカバリ機能」や「自動登録機能」という便利な機能が備わっています。 (ディスカバリ機能はZabbix1.4以降、自動登録機能はZabbix1.8以降で導入されている機能です。) 今回はこの2つの機能についてご紹介します。なお

keihs 2012/05/12

リンク

大規模ソーシャルゲーム「ドラゴンコレクション」運営の最前線で得られたノウハウ　～チューニングと運用、18のポイント～

11月25日、「mobidec 2011」においてコナミデジタルエンタテインメントのスタジオITセンター長である正延光弘氏によるセッション「大ヒットSNS ゲーム『ドラゴンコレクション』を支えるコナミのクラウド技術の活用」が行われました。ドラゴンコレクションは、GREEで提供されている携帯電話向けのカードゲームタイプのRPG。プレイヤーは、エリアごとにある複数のクエストをクリアしていき、モンスターカードや「秘宝」を手に入れ、さらに「ドラゴンカード」を集めていきます。また、ほかのプレイヤーとバトルすることでも秘宝を入手できるというSNS要素も取り入れられていました。2010年9月のサービス開始後、順調にプレイヤー数を伸ばし、現在では登録人数が500万人を超えています。サービス開始当初は社内でサーバを構築し、フロントエンドに6台のサーバ、バックエンドに3台のデータベースサーバ、そしてロードバ

keihs 2011/12/22

リンク

システム運用では、原因究明より大切なことがある

システムに異常が発生した際、原因を究明することも大切だが、そればかりに気を取られてしまうとITシステムにとって最も大切な「業務の遂行を安定的に支える」という要件を無視することになりかねない。インシデント管理の本質は現状復帰。原因究明ではない皆さん、こんにちは。今回は、障害対策の第3回目、原因究明と再発防止に関してです。ここまでさんざん「インシデント管理＝障害対応」ではない、と書いてきました。しつこいようですが、これは非常に重要なことなので今回も繰り返します。インシデント管理の本質は原状復帰です。この中には、原因の究明も、故障部分の修理も、本質的には含まれません。ただ、インシデントの原因がどこに潜んでいるか、という「切り分け」は行います。メールが送受信できなくなった、というインシデントに対して、メールサーバが悪いのか、ネットワークの経路のどこかが悪いのか、クライアント側のメールソフトが

keihs 2011/09/22

リンク

Av-jyo.com

The domain av-jyo.com maybe for sale. Click here for more information. Av-jyo.com Related Searches: MatchMaking Services Divorced Dating Speed Dating Christian Dating International Dating Sites Privacy Policy|Do Not Sell or Share My Personal Information

keihs 2011/08/19

リンク

多人数開発で Git を使う場合の環境構築 | GREE Engineering

こんにちは、インフラやってる sotarok です。最近、社内でも「sotarok はそーたろっくと読む」という誤解が広がっていましたので改めて自己紹介しますと、sotarok と書いて「そーたろー」または「そーたろー・けー」と読みます。ロックしてないのでよろしくお願いします。今日は、Git の話です。 GREE ではずっと Subversion を使っているという話を、以前開発環境の話をしたときに少し触れたことがあります。Subversion での運用方法も、GREE では割と面白い運用をしているのでその話もどこかでしたいのですが、まあ、それは今回は置いておきましょう。どこかで聞いてください。 GREE もその昔 CVS から Subversion に移ったのですが、時代は流れるもので、いよいよ Git 化という流れがきています。Subversion と Git の違いを今更あえて挙

keihs 2011/05/13

運用
git

リンク

スタートアップ企業で8年間Webの開発をしてみての反省点いろいろ - Masatomo Nakano Blog

2002年、当時設立したばかりの会社に入り、何もない状態から、コンテンツとシステムを作り続け8年が経った。日々、試行錯誤しながら、それなりに会社も大きくなり、まだ、大成功とは言えないけど、それなりにうまくやってきたつもりだ。しかしながら、その8年という短くはない時間の中で、色々な課題や問題が発生し、その時々正しい選択をしてきたつもりだったけど、反省点も多い。もう一度スタートアップに参加するとしたら、やり直したいところや、もっと早くこうしていれば良かったというところがたくさんある。そんなわけで、次の挑戦のときに忘れないように、また、もしかして誰かの参考くらいになればと思い、メモっておくことにした。1 まず、反省点の前に、何をやっているのかというのを簡単に。ビジネスとしては、英語e-learningのWebサービス(ネットを使った英語のお勉強)をASPな形で、企業や大学などに提供している

keihs 2010/10/20

リンク

Linux/UNIX 上でコマンドの実行履歴を残す方法

最近、セキュリティ関連の話が多いが身の回りで多いのですが、今回は、Linux / UNIX 系で誰がいつどのコマンドを実行したかってのをログにとる方法のお話しです。「＠IT：止められないUNIXサーバの管理対策第6回 - Page2」にも参考になるロギングの話が掲載されていますが、実行コマンドのログをとる方法は以下の５つが考えられます。 sudo を使って実行ログをとる .bash_history を定期的にバックアップして実行ログとして保存する script コマンドを使うことで実行ログ（画面出力のコピー）をとるシステムアカウンティング機能（psacct）を有効にして実行ログをとる実行シェルを改造し、ログを保存するようにする僕が考えつくところで、セキュリティ的に最も強固であるのはシェルの改造と思います。但し、その OS 上で使える Shell をその改造 Shell のみに限定

keihs 2010/06/26

リンク

レプリケーションしてるMySQLで、マスタやスレーブが障害停止した場合のリカバリプラン - （ひ）メモ

MySQLで、レプリケーションベースのHAな構成について考えたメモです。 3台(というか2台＋1台)がいいかなぁと思っていて、前半はその理由を、後半では{マスタ,スレーブ}が{再起不能になった,ちょっとダウンしてすぐ復帰した}場合のリカバリプランについて書きます。今のところはこれがベストかなと思っているのですが、「こうしたほうがいいと思う！」「ここがおかしい！」などなどのご意見はコメント、TBなどでいただけるとうれしいです。ゴールマスタが落ちてもぐーすか寝ていられるようにしたいリカバリの作業はできるだけ単純に、かつ、短時間で完了するようにしたいめんどくさいのはいや基本構成、方針 2台＋1台サービスで使うのは2台 (db1, db2) もう1台は管理用 (db3) スレーブを多数並べる構成にはしない台数増えると管理コストが上がるマスタダウン時のフェイルオーバとそのフェイルバ