タグ

ブックマーク / antibayesian.hateblo.jp (2)

  • Javaプログラミング始めました - あんちべ!

    最近話題の大規模分散処理システムHadoopやWikipediaなどでも利用されている全文検索エンジンLuceneなど、Javaで書かれたアプリケーションは数多くあります。それらを利用するにはJavaからアクセスするのがもっともパフォーマンスが良いです。そのため、大規模データを扱うのであれば、Javaを身につけておくことは非常に有意義だと思われます。また、データマイニングツールWekaやHadoop上で動く機械学習ライブラリMahoutなどもJavaで書かれており、機械学習用の豊富なライブラリを利用できるようになるのも重要です。さらに、JVM上で動くLispことClojureは、直にJavaのクラスを呼び出すことが出来るのですが、その折角の機能も、Javaの知識がないと宝の持ち腐れです。要するに、機械学習や自然言語処理を行う上でJavaはとても重要です、学びましょう。 なお、教科書には「E

    Javaプログラミング始めました - あんちべ!
  • twitterの呟きを収集するアプリ "SakusakuTwitterMining ver0.1" 公開 - あんちべ!

    ※2011/10/2 ver0.2になりました。 更新内容 64bit版対応 https対応 微修正 csvで吐くのが不評だったため、txtで出力(しかしボタン名修正するの忘れた… SakusakuTwitterMiningのダウンロード http://www24.atpages.jp/antibayesian/app/ 32bit版OSをお使いの方→stm32.zip 64bit版OSをお使いの方→stm64.zip ●概要 twitter Streaming APIを用いて日語のtweetを自動収集します。 マウスクリックだけで操作可能です。 テキストマイニングをするためには、まずテキストを収集しなければなりませんが、 プログラミング経験が無いとその時点で躓いてしまいます。 誰でも簡単にtweetを収集するために作成しました。 ●ご利用頂ける環境 Windows XP以降 .NET

    twitterの呟きを収集するアプリ "SakusakuTwitterMining ver0.1" 公開 - あんちべ!
  • 1