汎用連想計算エンジン GETA というのを使って、ブログの”このエントリに似た内容のエントリ”を出せるかどうかのテストをしてみる。 しくみとしては、ドキュメントの単語に分解して、行にドキュメント、列に単語を並べたほとんどの要素がゼロになるような巨大な行列をつくって、その行列から出現頻度が似ているものを取り出すことで似ているかどうかを調べることができるようです。 GETAは後半の巨大な行列の計算をしてくれますが、前半部分のtokenizeと行列の生成は自分でやる必要があります。 build まずはGETA のごく簡単なチュートリアルに従ってgetaをつくります。 今回使用する環境は solaris10 for x86 です。 % uname -a SunOS dokodemo 5.10 Generic_118844-26 i86pc i386 i86pc Solaris tarを展開し
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く