pycolのブックマーク - はてなブックマーク

多段fluentd + mongodb のハマリ所 - stanaka's blog

fluentdを多段構成にして、mongo dbに出力するところでハマったのでメモ。上の構成のように、各サーバにfluentd + out_forwardを置き、集約するログサーバにfluentd + out_mongoでmongo dbに出力している場合に、上段のfluentdでbuffer_chunk_limitを10mより大きい値にしていると、エラーになることがあります。まず、out_mongoでbuffer_chunk_limitを10m以内にしないといけない理由は、fluentdからMongo DBへ連携する際の注意点 #fluentdを参考にしてください。ここで多段構成の場合、上流の buffer_chunk_limitが大きいと上流から大きなサイズのデータの塊が流れてくることがあります。それを受けとったfluentdはそれをそのままoutput pluginに流す実装となって

pycol 2013/02/22

あとでみる

リンク

fluentd + mongodb+ node.js でリアルタイムにグラフを描く - stanaka's blog

追記 2/22 毎回微妙に追記していますが、今回も追記です。最後にmongo dbのinsert性能について80lines/secで厳しくなった、と書いてますが、環境か設定まわりがあやしいので訂正します。もうすこし検証してみようと思います。 → 検証して fluentd側の設定の問題であることが分かりました。詳しくは、http://blog.stanaka.org/entry/2013/02/22/171053 追記ここまで最近は、fluentd + mongo db でログを蓄積していろいろ便利に使っているわけですが、数分に一回集計スクリプトを周したり、 GrowthForecast の画面をリロードしまくるのではなく、もっとリアルタイムで見たい! という欲求が募ってきたので、 node.js を使って実装してみました。( https://github.com/stanaka/realti

pycol 2013/02/21

あとでみる

リンク

Emacsからオフラインで使えるリファレンスブラウザDashを呼び出す - stanaka's blog

追記 2/17 現在のmajor-modeに対応して、検索対象のdocsetが絞りこまれるようにしました。以下のようにカスタマイズすることもできます。 (add-to-list 'dash-at-point-mode-alist '(perl-mode . "perl")) 追記ここまで OSXで開発している時に各言語やライブラリのリファレンスをオフラインで検索したい、とTweetしたところ、 @stanaka Dash ってアプリがオススメ。あれの docset てのが chm でやってたのと似てる気がする。iOS のマニュアル引くのに愛用してるお— Naoya Ito (@naoya_ito) February 17, 2013 とid:naoyaさんにお勧めしてもらったDashを試してみました。各言語、ライブラリのリファレンスが簡単にダウンロードでき、それをオフラインで高速に検索でき

pycol 2013/02/18

あとでみる

リンク

Labeled Tab Separated Values (LTSV) ノススメ - stanaka's blog

追記(2/8 11:30) id:naoyaによる一連のまとめが【今北産業】3分で分かるLTSV業界のまとめ【LTSV】 - naoyaのはてなダイアリーにあります。また、仕様などをまとめるために http://ltsv.org/ を立ち上げました。追記ここまで Labeled Tab Separated Values (LTSV) というのは、はてなで使っているログフォーマットのことで、広く使われているTSV(Tab Separated Value)フォーマットにラベルを付けて扱い易くしたものです。はてなでは、もう3年以上、このフォーマットでログを残していて、one-linerからfluentd、Apache Hiveまで幅広く便利に使えています。ログフォーマットに期待されることは、フォーマットが統一されている → 共通のツールで集計し易い新しいフィールドの追加が容易 → サー

pycol 2013/02/06

あとでみる

リンク

Kindle Paperwhite向けに自炊pdfを最適化する - stanaka's blog

id:halfrackがKindle Paperwhiteのタワーを作っていたので、Kindle Paperwhite向け自炊pdfの最適化をしてみました。 Kindle Paperwhite向けの自炊pdf最適化は、余白を適切に削除すること画像を最適なサイズである横658ドット x 縦905ドットにすることの2つが大事です。特に後者が重要で、デバイスごとに最適なサイズにすることでpixel by pixelで表示することができます。ちなみに、これまでのKindleでは横560ドット x 縦735ドットが最適でした*1。調査には1ピクセルごとに線を入れたpdfを作成して行いました。このpdfでは、ページごとに画像サイズを1ピクセルずつ変えていて、最適な解像度ではない場合、綺麗に一様な模様にならず、すぐに分かります。これでちょっとずつ探りながら最適なサイズを探すわけです。地道ですね。

pycol 2012/10/16

あとでみる

リンク

1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めの本です。ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

pycol 2008/05/14

リンク

はてなブックマーク

タグ

ブックマーク / blog.stanaka.org (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス