タグ

2011年11月23日のブックマーク (6件)

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • GODI - Ocaml for Everybody

    GODI is discontinued. This is the archived content of the former site godi.camlcity.org. GODI bundles the Ocaml compiler with a large list of add-on packages, and serves as a development platform for Ocaml applications. GODI makes it very easy to install open source libraries for all kinds of development areas on your computer. It is intended as a daily toolkit for developers who are mainly intere

  • ocamlscript: natively-compiled OCaml scripts

    Introduction ocamlscript compiles scripts, i.e. one-file programs, into natively-compiled binaries, and executes them. Basically, a script named alpha is compiled into alpha.exe. If alpha.exe is more recent than alpha, then alpha.exe is executed directly, otherwise alpha is recompiled first. Compilation commands reside in the first section of the script. They are written in OCaml and consist norma

  • batteries

    An effort to define a comprehensive standard library for OCaml, inspired in part by what modern industrial languages (Java/.Net) manage to provide out-of-the-box. Members: user593 user492 user142 user146 user188 user152 user194 user145 user234 user112 user228 user172 user574 user533 user103 user105 user135 user142 user146 user4449 user4449 user10125 user20475 user18347 user18347 Releases Registere

  • 最速の疎ベクトルはどれだ - Preferred Networks Research & Development

    海野です。 自然言語処理などで機械学習を行おうとすると、非常に疎なベクトル表現を使いたくなります。疎、というのはほとんどの要素が0である、という意味です。前々から疎ベクトルライブラリのパフォーマンスに関して気になっていたので、幾つか調べてみました。 Jubatus Workshopでも話したとおり、機械学習を適用しようとすると、普通は対象のデータをベクトル表現に落とします。特に言語データの場合は、それぞれの単語や文字などを特徴次元とするため、非常に疎なベクトルとなってしまいます。純粋な配列(C++で言えばstd::vector)を使ってしまうと、大量にメモリをってしまうため疎ベクトル専用の表現を使うのが普通です。 今日は様々な疎ベクトルライブラリのパフォーマンス比較を行おうと思います。比較したライブラリは以下のとおり。真の意味で、疎ベクトルのライブラリは、Eigenとublasだけで、残

    最速の疎ベクトルはどれだ - Preferred Networks Research & Development
    gologo13
    gologo13 2011/11/23
    eigen
  • [D] こんにゃくは、新世代の日本語入力プログラムです。

    私はこんにゃく新世代日本語入力プログラムを使用してこのブログのエントリを書いています。 今日、Mootoh こんにゃく 0.2 をリリースしました。 mootoh/Konjac @ GitHub Motohiro Takayama - Google+ - Konjac 0.2 をリリースしました。 変更点: - バックスペースキーを有効にし、実用に耐えるように -… (追記) さすがに乱暴すぎたのでちょっとだけまともに日本語入力して追記。 バイナリーはここからダウンロードできるので、興味ある方はぜひお試しくださいませ。 宴会芸並くらいには楽しめますw ある日、私たち (Mootoh、Niw、私は) Skype のチャットでした。Mootoh 突然新しい日本語入力プログラムのアイデアに触発。このアイデアは、日本語入力変換エンジンとして Google やビンビン(Bing)の tranlate

    gologo13
    gologo13 2011/11/23