タグ

getaに関するkaz_gotoのブックマーク (2)

  • 楽天技術研究所のテクノロジー講演会「連想の情報学」にいってきた

    楽天技術研究所の森正弥さんに誘っていただいて、テクノロジー講演会に行ってきました。 今回は「連想の情報学」がテーマで 国立情報学研究所 高野 明彦 教授にお話を伺うことが出来ました。 簡単に言うと「検索結果を使って、関連情報を検索できる」 といったところです。 物を思い出す時って、人間もそうですが、何かの連想から生まれることが多いです。 例えば、 「あーあれなんだっけ文防具の」 「なに?」 「針と鉛筆がついてて円を書くあの道具」 「あーえーっと、コンパス!」 「それそれコンパス!」 つまりは、赤といえばりんご、りんごといえば果物みたいな、 連想的に検索が行える仕組みの話です。 それを具現化し実現化したものが「GETA」というエンジン。 これはオープンソースで、ASCII24の関連記事の表示などにも使われているそうです。 では実際に連想検索をどうやって実現するかについて簡単に触れてみます。

    楽天技術研究所のテクノロジー講演会「連想の情報学」にいってきた
  • GETAを関連エントリ抽出に使ってみる « ku

    汎用連想計算エンジン GETA というのを使って、ブログの”このエントリに似た内容のエントリ”を出せるかどうかのテストをしてみる。 しくみとしては、ドキュメントの単語に分解して、行にドキュメント、列に単語を並べたほとんどの要素がゼロになるような巨大な行列をつくって、その行列から出現頻度が似ているものを取り出すことで似ているかどうかを調べることができるようです。 GETAは後半の巨大な行列の計算をしてくれますが、前半部分のtokenizeと行列の生成は自分でやる必要があります。 build まずはGETA のごく簡単なチュートリアルに従ってgetaをつくります。 今回使用する環境は solaris10 for x86 です。 % uname -a SunOS dokodemo 5.10 Generic_118844-26 i86pc i386 i86pc Solaris tarを展開し

  • 1