タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

bayonに関するjazzanovaのブックマーク (3)

  • [perl]Algorithm::Bayonなぞ作ってみた - taiyoh独言

    お久しぶりです。色んなものを作りかけたまま放置してしまってすいません>< ぼちぼち収拾していきますので。 そう言いつつ、またなんか作ってしまったのですが。 不肖私、mixiの方が作った"bayon"というクラスタリングツールを今更になって触ってみたところ、あまりの速さに感動してしまったので、弊社某サービスで使っているAlgorithm::Clusterからのスイッチを狙っています。 とはいえ、bayonの入出力の形式はtsv(しかも出力は標準出力)なので、Perlから直で扱うにはちと不便。なので、コマンドラインのラッパーとIOまわりをある程度抽象化してまとめたツールをこしらえました。それが表題のAlgorithm::Bayonです。 →http://github.com/taiyoh/algorithm-bayon-perl/tree/master 例によって俺クオリティの影響でドキュメン

    [perl]Algorithm::Bayonなぞ作ってみた - taiyoh独言
  • クラスタリングツール bayon がとてつもなく素晴らしいです!

    クラスタリングツール bayon がとてつもなく素晴らしいです! 2009-06-10-5 [Algorithm][Software] mixi の fujisawa さんによる、C++ で書かれたクラスタリングツール bayon がシンプルイナフで猛烈に素晴らしくてクールです。 - 軽量データクラスタリングツールbayon (mixi Engineers' Blog) http://alpha.mixi.co.jp/blog/?p=1049 - チュートリアル(Tutorial_ja - bayon) http://code.google.com/p/bayon/wiki/Tutorial_ja 詳細は上記URLを見てもらうとして、 たまたま手元に250万件のデータ(ラベル+特徴語リスト)があったのでさっそく試してみました。 ドキュメント数250万件。 各ドキュメントの特徴を現すキーの平

    クラスタリングツール bayon がとてつもなく素晴らしいです!
  • 軽量データクラスタリングツールbayon - mixi engineer blog

    逆転検事を先日クリアして、久しぶりに逆転裁判1〜3をやり直そうか迷い中のfujisawaです。シンプルなデータクラスタリングツールを作成しましたので、そのご紹介をさせていただきます。 クラスタリングとは クラスタリングとは、対象のデータ集合中で似ているもの同士をまとめて、いくつかのグループにデータ集合を分割することです。データマイニングや統計分析などでよく利用され、データ集合の傾向を調べたいときなどに役に立ちます。 例えば下図の例ですと、当初はデータがゴチャゴチャと混ざっていてよく分からなかったのですが、クラスタリングすることで、実際は3つのグループのデータのみから構成されていることが分かります。 様々なクラスタリング手法がこれまでに提案されていますが、有名なところではK-means法などが挙げられます。ここでは詳細については触れませんが、クラスタリングについてより詳しく知りたい方は以下の

    軽量データクラスタリングツールbayon - mixi engineer blog
  • 1