sh2のブックマーク - はてなブックマーク

HadoopによるApacheのログ解析の実際

こんにちは、ミツバチワークス stoneです。今日は、DECOLOGで行われている、Apacheのログ解析について、ご紹介してみようかと思います。現在、DECOLOGでは、リバースプロキシが8台あって、その8台の1日のApacheのログは、全部で、200Gバイト以上になっています。これを、13台のHadoopのスレーブノードで解析を行っています。全体の流れとしては、 1) リバースプロキシからHDFSにログを転送 2) 解析用のサーバーで、HDFSにログの転送が終わるのを監視 3) ログの転送が終わったら、Hadoopを起動、解析 4) Hadoopの解析結果をデータベースに保存以下では、各々のステップを個別に見て行くことにしますね。 1. リバースプロキシからHDFSにログを転送当初、Hadoopのプロセスが立ち上がっていないと、HDFSにはアクセスできない、と思い込ん

sh2 2012/01/24

2億PV/日ってすごいな

hadoop

リンク

DECOLOGでのMySQL Archiveエンジンの使い方

こんにちわ、stoneです。今回は、MySQLのストレージエンジンの中の１つ、ArchiveエンジンのDECOLOGでの使い方をご紹介したいと思います。 ※「DECOLOGでのMySQL BlackHoleエンジンの使い方」も合わせてどうぞ Archiveエンジンの概要MySQLのマニュアルをご覧いただくのが正確なのですが、その特徴を簡単にまとめると。。。。 insert/selectは出来るが、update/deleteは出来ない order byはサポートされない blobもサポートされないデータは圧縮されてディスクに保存されるまぁ、最初にこのマニュアルを読んだときの、正直な感想は、「どうやって使うんだ、これ？」って感じでした。 deleteが出来ないので、データは溜まる一方だし、データは圧縮して保存されているので、selectもそんなに速くないことは容易に想像できます。ア

sh2 2010/11/29

SELECTしてファイルに落としてHDFSに置いて、というところを中抜きできないかなあと思った。redisでどうやるかも知りたい

mysql
hadoop

リンク

replicationしてるMySQLのslave増設手順

こんにちは、hiroshiです。おひさしぶりですね。 stoneが書いたhadoopの記事が打ち合わせとかで「見ましたよ。評判ですよ。」とか言われてジェラシーいっぱいです。僕もがんばります。目指せホッテントり！といっても、僕だと書けることに限界があるので、今日は半定常作業のMySQLの増設作業について書こうと思います。下図のように、master1台←slave2台がLVS+keepalivedで負荷分散構成されているDBがあるとします。この構成の組み方にしようかと思ったのですが、これはググったらいっぱいあったのでホッテントリは狙えないと思ってやめました。なので、今回のテーマは「このテーブルはwriteは余裕だけどreadがきつくなってきたからslaveを増設しなければ！」となった場合のslaveを増設する手順について書いてみます。下図のslaveCを追加するぞ！の場合です。 ※

sh2 2010/11/15

slave Aのmysqldをshutdownして、slave Cにはrsyncなどでデータファイルを物理コピーした方が速い気がします

mysql

リンク

はてなブックマーク

タグ

ブックマーク / tech.dclog.jp (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス