[B! チューニング] pandazxのブックマーク

HadoopのMapReduceジョブのチューニングに関する資料があったのでめもっとく - wyukawa's diary

Hadoop Summit 2012でClouderaの人が発表した資料を見つけたのではっておく。 Hadoop Summit 2012 | Optimizing MapReduce Job Performance View more PowerPoint from Cloudera, Inc. HadoopのMapReduceジョブのチューニングに関するもので、内容的にはHadoop徹底入門の10章の「性能向上のためのチューニング」と若干かぶっているが参考になります。 spillとかのシャッフルフェーズをどうチューニングするかについて詳しく書かれていて、record fullってログに出てたらメタデータがspillしてるからよくないよねみたいなことが書かれてます。徹底入門だと10.2.2の「Map処理でのフレームワークのチューニング」に書かれていますね。ていうかio.sort.reco

pandazx 2012/11/09

リンク

Hiveメモ - wyukawa's diary

HiveのTipsかもしれないものを２つ知ったのでいちおうメモっとく。何でこうなるかはわかってない。バージョンは0.6ね。まず1つめ aaaとbbbという２つのテーブルがあって、それぞれcolumn1というパーティションキーがあって、このキーで結合しつつcolumn1が1なものを求めたいっていう場合は select * from aaa a join bbb b on a.column1 = b.column1 and a.column1 = 1 ;だとMap数が膨大になるが、 select * from aaa a join bbb b on a.column1 = b.column1 and a.column1 = 1 and b.column1 = 1 ;とすれば大丈夫。２つめ aaaというテーブルがあってcolumn1カラムの値がhogeな件数を求めたいって場合は sel

pandazx 2011/08/02

リンク

MySQL の wait_timeout と thread_cache_size の関係 | Carpe Diem

Jeremy Zawodny 氏のブログに MySQL, Linux, and Thread Caching という興味深い記事があったので、理解するために自分翻訳してみた。この記事は、今はないけれども rember.yahoo.com で MySQL を使ったときの話のようです。ちなみに MySQL のバージョンは 4.0.4。わぉ、とても忙しい一週間だった。私は、remeber.yahoo.com の MySQL サーバや関連するものごとに実に何日かを費した。そして、私は1日か2日を休息に使った(睡眠やシャワーなど) ところで、私はいくつか興味深い発見をした。もっとも驚いたことは MySQL サーバがとても忙しくなったときの Linux 上でのスレッドキャッシングの挙動だ。ポイントは、忙しいときのみということだ。忘れずに。あなたも分かっていると思うが、われわれがすべてのウェブサーバ

pandazx 2010/09/09

スレッドをキャッシュすることでCPU負荷を減らす

リンク

Linux 最大ファイルディスクリプタ設定 - rinn@wiki

core file size (blocks, -c) 0 data seg size (kbytes, -d) unlimited file size (blocks, -f) unlimited max locked memory (kbytes, -l) 4 max memory size (kbytes, -m) unlimited open files (-n) 1024 <-- ここです。 pipe size (512 bytes, -p) 8 stack size (kbytes, -s) 10240 cpu time (seconds, -t) unlimited max user processes (-u) 7168 virtual memory (kbytes, -v) unlimited

pandazx 2009/09/01

リンク

Kazuho@Cybozu Labs: MySQL のボトルネックを統計的に監視・解析する方法

MySQL のチューニング、と言った場合には、サーバーパラメータの調整や EXPLAIN コマンドを利用したクエリ実行計画の最適化が話題に上ることが多いです。しかし、発行する全ての SQL について、いちいち EXPLAIN コマンドを使って確認していては、いくら時間があってもたりません。チューニングを効率的に進めるには、まず、ボトルネックとなっている SQL クエリを特定し、次にその最適化を行うべきです。ではどのようにして、ボトルネックを特定するのか。MySQL Conference & Expo 2009 のキーノートにおいて Mark Callaghan 氏は、Google では SHOW PROCESSLIST コマンドを使った統計的アプローチを使っていると述べていらっしゃいます (参照: MySQLConf 09: Mark Callaghan, "This is Not a

pandazx 2009/07/22

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

チューニングに関するpandazxのブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス