タグ

2012年7月20日のブックマーク (2件)

  • github もうちょい入門 - glasses factory

    github 超入門という記事を以前書いてからずいぶん経っていますが ここ最近になって続きはまだ?とか、いい加減 github にアップさせてくださいといった声をもらうようになったので 重圧に耐えかねて「もうちょい入門」を書いてみようと思います。 新 MBA が出て Win から Mac に乗り換えたり、サブマシンとして用意した人々が これを機会に開発環境を一新する or 整えようの一環として、 git を導入しようと考えている人が多いのかなーと野暮な勘ぐりをしてニヤニヤしてみたり。 前置きはこの辺にして、題に入っていこうと思います。 冒頭でも述べましたが、今回は github へアップするところまでやってみたいと思います。 まず github にアップするためには、前提として github のアカウントが必要になります。 github のアカウント作成方法については、

  • ナイーブベイズを用いたテキスト分類 - 人工知能に関する断想録

    今までPRMLを読んで実装を続けてきましたが、10章からは難しくて歯が立たなくなってきたのでここらで少し具体的な応用に目を向けてみようと思います。機械学習の応用先としては画像の方が結果を見ていて面白いんですが、当面は自然言語処理を取り上げます。そんなわけで一番始めの応用は機械学習と自然言語処理の接点として非常に重要なテキスト分類(Text Classification, Text Categorization)の技法たちを試していきたいと思います。テキスト分類は文書分類(Document Classification)という呼び方もあります。テキストと文書は同じ意味です。最初なので自分の知識の整理と入門者への紹介のためにちょっと丁寧にまとめてみました。 テキスト分類とは テキスト分類とは、与えられた文書(Webページとか)をあらかじめ与えられたいくつかのカテゴリ(クラス)に自動分類するタス

    ナイーブベイズを用いたテキスト分類 - 人工知能に関する断想録