いきなり思い立って30分プログラミング(終わってみれば30分どころではなかった).Perlらしいオブジェクト指向で,それなりに綺麗に書けた.ただ,データ保持のところが気に食わない.一番簡単なmultivariate bernoulli modelを実装した(単語が文書に現れるか否かをモデル化するもの.文書あたりの出現頻度は考慮しない). Naive Bayesをはじめ,機械学習手法を勉強するのによさげな簡単なコードってそんなに見つからないのでKY公開.Wekaのソースコード嫁とかいわないでください.NBは頻度表を保存するだけで良いので,おそらくどんな言語でも100行未満で書ける.LLだとワンライナーとかいそう….他のNB手法も実装したいなー 研究室の導入研修にちょうど良いと思っているのだけれど,言い出せずにいる.PerlじゃなくてJavaとかRubyでも実装してみよう. そーすこーど pa