タグ

getaに関するendorのブックマーク (7)

  • Section 1 (tutorial for libae)

    はじめにlibae を使って電子メール検索プログラムを作る類似度定義ファイルの基礎類似度を定義してみる複雑な類似度を定義する関連文書検索,適合性フィードバックを実装するAND 検索を実装する1  はじめにこのチュートリアルでは, 「WAM チュートリアル」で作った 電子メール検索プログラムをもとにして, 検索要求と文書との類似度計算式をカスタマイズする方法について学びます. まずは「WAM チュートリアル」を一通り読んで, 電子メール検索プログラムを作ってください. 実行すると以下のようになるはずです. $ ./Msearch 昨日、猿が現れました ^D 3 inbox/2 2 inbox/1 1 inbox/4 1 inbox/3 ...「昨日、猿が現れました」が検索要求です."inbox/1"などが検索結果の文書です. その前の数字は, それぞれの文書が含んでいる検索単語の異り数です.

    endor
    endor 2009/04/05
  • Perl インタフェース活用術 ― 連想検索GUIの実現方法

    Perlインタフェース活用術 ― 連想検索GUIの実現方法 ― 1. はじめに 汎用連想計算エンジンGETAに含まれるPerlインタフェース (以後,WAMモジュールと呼びます) を利用して,以下の機能を有する連想検索GUIを実現する方法について解説します。 フレーズ検索 ユーザが入力した検索要求を検索キーとして関連文書を検索する機能。 文書要約 文書から特徴語 (トピックワードと呼ぶ) を抽出し,抽出した特徴語を検索結果の要約とする機能。 文書連想検索 ユーザが選択した文書を検索キーとして関連文書を検索する機能。 トピックワード検索 ユーザが選択したトピックワードを検索キーとして関連文書を検索する機能。 以下に進む前に,GETAのインストールとコーパスのセットアップを完了させておいて下さい。 2. 準備 2.1 WAMモジュールの読み込み WAMモジュールを使うには, use wam (

    endor
    endor 2009/04/05
  • GETAによるファイル全文検索

    GETAによるファイルの全文検索 Up$Date: 2003/01/05 10:05:20 $ $Revision: 1.1 $ (UnixMagazineに 記事を書きましたので こちらも参照下さい - 2003/4/29) 情報学研究所の高野氏/ 日立の西岡氏らによる GETA というライブラリを使うことにより ファイルの全文検索を行なうことができる。 GETAの使い方 チュートリアルが 用意されているが、いまひとつわかりやすいとはいえないので、 忘れないように書いておく。 GETAプログラムは標準で /usr/local/geta にインストールされる その下の sbin/mkw を使って、単語出現マトリックス WAM (Word-Article Matrix)を作成することにより tf/idf法などによる検索を高速に実行することができる。 WAMは疎行列を効率的に表現するデータ構造

    endor
    endor 2009/04/05
  • GETA-Ruby プラグイン公開 - elm200 の日記(旧はてなダイアリー)

    趣旨 GETA を Ruby を使って操作する GETA-Ruby ブリッジを作ってみた、というのが昨日までの話。そこで今度は Rails プラグインを作ってみた。Tar ball でインストールするよりはるかに簡単だ。Rails 使いの方は是非試してみてほしい。 前提条件 GETA 第2版をインストール済みであること。(ゆえに通常 OS は Linux/FreeBSD/Solaris あたり) Ruby 1.8+ & Ruby on Rails 1.2+ gcc 等 C のプログラムがコンパイルできる環境があること。 GETAROOT 環境変数に GETA インストールディレクトリを設定 (i.e. % export GETAROOT=/usr/local/geta) インストール方法 % cd $RAILS_ROOT % ruby script/plugin install http:

    GETA-Ruby プラグイン公開 - elm200 の日記(旧はてなダイアリー)
  • GETAの基礎

    GETAの基礎 大西 祥代,廣安 知之,三木 光範 ISDL Report No. 20070913003 2007年 4月 2日 Abstract 報告では,Generic Engine for Transposable Association :GETAについての概要を述べ,インストール方法,設定方法について報告する.GETAとは汎用連想計算エンジンのことであり,文書間や単語間の類似度を高速計算するツールである.GETAを応用して,連想検索,文書要約などを行う事が可能である. 1  はじめに 報告では,GETAについての概要を述べ,インストール方法,設定方法について報告する.GETAとは汎用連想計算エンジンのことであり,文書間や単語間の類似度を高速計算するツールである.GETAを応用することで,文書の連想検索や文書要約などを行う事ができる. 2  GETAとは GET

  • sunsept.com - このウェブサイトは販売用です! - sunsept リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • Linux ユーザーのための GETA 第3版インストール方法 - elm200 の日記(旧はてなダイアリー)

    汎用連想計算エンジン(GETA) は、大量のデータを高速に処理可能な高性能連想検索エンジンである。これを BSD 風のライセンスで自由に使わせてくれている国立情報学研究所は太っ腹なのだが、どうも私にはインストールが敷居が高いように感じられた。最近、最新版である GETA 第3版の作者である西岡真吾特任教授と知己を得たので、突撃インタービューを行い、インストール方法を教わるという幸せな体験をした。 GETA は現在 FreeBSD / Linux / Solaris 等 UNIX 風 OS で動作可能である。MacOSX は?というと今のところはうまくコンパイルできないらしい。私が Linux ユーザーなので、今回のエントリでは主に Linux にインストールする方法を中心に考えてみる。 私がインストールの成功を確認した環境は、"Linux CentOS 4(Linux 2.6.9)" と

    Linux ユーザーのための GETA 第3版インストール方法 - elm200 の日記(旧はてなダイアリー)
  • 1