タグ

ブックマーク / repeatedly.github.io (4)

  • Fluentdの現実装のPros/Cons - Go ahead!

    TODO: 必要なら図を足す 他に書いた方が良いPros/Consのリクエストがあったら追記 内部のイベントストリームの扱い Pros: Inputがスケーラブルに実装しやすく,データストリームを正常時/エラー時で切り替えやすい Cons: エラーハンドリングがブロッキングモデルよりも複雑になりやすい 以下長々と理由書きます. Fluentdはイベントストリームを効率良く,またロバストに扱うことを目的に設計されています.そのため,独自の転送プロトコル(forwardプラグイン)を実装していますし,内部のイベントのハンドリングもそれに沿うようになっています.ただ,それによって相性の悪い操作とかもあります. Fluentdはバッファ機能を提供しており,これによって転送の効率化とエラー時のデータロスを防ぐ設計になっています.が,あまりにも書き込み先が遅いなどの問題があると,バッファの制限を超えて

  • Fluentdとログ収集のパターン - Go ahead!

    「ログを集めて保存する」と言うのは簡単だけど,ログ収集の構成にはいくつか方法があり,勉強会などでちょくちょく聞かれるので,いくつかのパターンについて書く. 「俺はもうバリバリログ収集やってるぜ!」という人は多分すでに知っていることが書かれているので,タブを閉じて良い. ここではログコレクタにFluentdを想定しているが,他のログ収集プロダクトにも適用出来るはず. ただ,Fluentdはタグベースのルーティングを持ち,単体でもキューのように動作させることが可能で,既存のものより複雑な問題を解決しようとしているので,少し工夫が必要かもしれない. Fluentdそのものについては公式ドキュメントや,Fluentdとはどのようなソフトウェアなのかを参考に. クライアントから直接保存する いきなりFluentdを使わないパターン.JavaScript SDKを提供している解析サービスやモバイル端末

  • Change The Game - Go ahead!

    知ってる人はもう知っているとは思いますが,10月をもって1年と10ヶ月勤めた謎のベンチャーPreferred Infrastructure, Incを去りました.PFIの方々,当に有り難うございました! エントリを書けと色々な人に脅されているので,てきとうに書きます. 環境 インターンで飛び込み,そのテンションのまま大学を辞めて入社.俺みたいな機械学習や情報検索の基礎すらなかった人間が,今では機械学習プロジェクトで開発をやっていたわけですから,岡野原さんを筆頭に当濃い社員の人達には感謝しかありません. 学習の高速道路という言葉がありますが,間違いなく超高速,時には事故るんじゃないかという環境でした.右を見ても左を見ても怪物だらけであるこの魔窟で,エンジニアとして勤めることが出来たのは当に良い経験でした. 俺が入社した時は正社員は15人くらいだった気がしますが,今では既に26人で,もう

    hiroyukim
    hiroyukim 2012/11/01
  • Mongoプラグインの仕様 - Go ahead!

    分散パフォーマンステスト関係を書こうと思っていたんですが,よくよく考えたらMongoプラグインについて日語でまともな記事を書いたことなかったので書きます. このエントリはウィークリーFluentdユースケースエントリリレーの参加エントリです. 概要 MongoプラグインはMongoDBに対するInput/Outputプラグインを提供します.またユーティリティとして,MongoDBのcappedコレクションに対してtailを行うmongo-tailコマンドも付属しています. リポジトリ: https://github.com/fluent/fluent-plugin-mongo MongoDBは内部はBSONですが,API的にはJSONでやりとりしており,また明示的なスキーマもいらないため,Fluentd周辺では集計サーバやテンポラリサーバとして広く利用されています. td-agentには

    hiroyukim
    hiroyukim 2012/10/31
  • 1