タグ

getaに関するuchiuchiyamaのブックマーク (6)

  • 3分でできる GETA 2 インストール - elm200 の日記(旧はてなダイアリー)

    カンタン・インストールのススメ GETA 第2版はもともと第3版よりインストールが簡単だ。普通に GETA 家からソースコードを取得して INSTALL ファイルを読みながらインストールしてもいいのだが、こんな小さな問題もあり、知らないと微妙に時間がかかってしまう。そんな面倒を省くためにカンタン・インストールのシェルスクリプトを書いてみた。 対象者 面倒なことが嫌い人。 手っ取り早く結果がほしい人。 マニュアルなんて、なにそれおいしいの?という人。 前提条件 対象 OS は Linux のみ。(GETA 自体は FreeBSD/Solaris でもインストール可能だけどね) root に成れること。 インストール方法 1. 作業用ディレクトリに移動。 % cd $SOMEDIR2. root になる。 % su3. 次のスクリプトをシェルの画面にコピペすると、インストール完了。 wget

    3分でできる GETA 2 インストール - elm200 の日記(旧はてなダイアリー)
  • GETA-Ruby プラグイン公開 - elm200 の日記(旧はてなダイアリー)

    趣旨 GETA を Ruby を使って操作する GETA-Ruby ブリッジを作ってみた、というのが昨日までの話。そこで今度は Rails プラグインを作ってみた。Tar ball でインストールするよりはるかに簡単だ。Rails 使いの方は是非試してみてほしい。 前提条件 GETA 第2版をインストール済みであること。(ゆえに通常 OS は Linux/FreeBSD/Solaris あたり) Ruby 1.8+ & Ruby on Rails 1.2+ gcc 等 C のプログラムがコンパイルできる環境があること。 GETAROOT 環境変数に GETA インストールディレクトリを設定 (i.e. % export GETAROOT=/usr/local/geta) インストール方法 % cd $RAILS_ROOT % ruby script/plugin install http:

    GETA-Ruby プラグイン公開 - elm200 の日記(旧はてなダイアリー)
  • 楽しい GETA はお好きですか?(GETA-Ruby ブリッジ公開) - elm200 の日記(旧はてなダイアリー)

    趣旨 GETA を Ruby を使って操作する GETA-Ruby ブリッジを作ってみた。Ruby の拡張ライブラリの勉強も兼ねてのことだ。久しぶりの C プログラミングだったが、Ruby の拡張ライブラリの書きやすさは異常。まつもとさんのプログラミングしやすさへのこだわりが C の世界にも貫かれているのはすごい。今回の GETA-Ruby ブリッジは GETA 2 用。かなりコツはつかんだので、GETA 3 用のブリッジを書くのはそれほど難しくないかも。 前提条件 OS は Linux でだけ試した。FreeBSD でも動くとは思う。他の OS はよくわからない。 Ruby 1.8+ サンプルコードを実行するときには GETAROOT 環境変数が GETA のインストールディレクトリを指すようにしておくこと。 サンプルコード $LOAD_PATH.unshift(File.expand_

    楽しい GETA はお好きですか?(GETA-Ruby ブリッジ公開) - elm200 の日記(旧はてなダイアリー)
  • GETA 第2版 連想計算関数 wsh() の歩き方 - elm200 の日記(旧はてなダイアリー)

    趣旨 GETA 2 を使って連想検索を行う上で、もっともコアになる関数が libae.a にある wsh() である。しかし使い方がなかなか厄介である。ネットを探しても情報が少ないので、結局、$GETASRC/lib/ae/wsh.c というソースコードの解読を試みた。 wsh.c には wsh() という関数がひとつだけ定義されていて、おそらく高速化のためだろうが、関数呼び出しを極力行わないようにしている。$GETASRC/lib/ae/wt/*.f という類似度定義ファイルの内容も、最終的には wsh.c にインクルードして、wsh() に組み込む形で実行している。高速化重視で、やや可読性が失われているため、wsh() は相当読みづらかったが、なんとか解読に成功した。 wsh() の使い方について、具体例を交えて説明したい。 情報ソース まず説明の前に、有益な情報ソースへのリンクを掲げ

    GETA 第2版 連想計算関数 wsh() の歩き方 - elm200 の日記(旧はてなダイアリー)
  • GETA 第2版 類似度定義ファイルの実装 - elm200 の日記(旧はてなダイアリー)

    昨日 GETA 第3版のインストールについて説明しておいて、今日はなんで第2版か?と思うかもしれないね。第3版は、情報が少ないのでなかなか扱いが大変なのだ。第3版の方が性能はいいのは間違いないので、とりあえずは第2版で慣れておいて、第3版へ挑戦しようという算段なのだ。 さて GETA 2 では libae.a にある wsh() という関数を使って連想検索を行う。チュートリアルの2 libae を使って電子メール検索システムを作るを参照のこと。 wsh() は、簡単に言えば、行(列)の頻度ベクトルから列(行)の頻度ベクトルへの写像だ。「行(列)」とか書くのが面倒なので、ここでは「軸」という概念を定義することにする。(これは別に正式な用語でもなんでもなく、私が説明のために便宜的にでっち上げた言葉なのであしからず) 軸とは「行」または「列」である。 基準軸は、とりあえず注目している軸のことであ

    GETA 第2版 類似度定義ファイルの実装 - elm200 の日記(旧はてなダイアリー)
  • Linux ユーザーのための GETA 第3版インストール方法 - elm200 の日記(旧はてなダイアリー)

    汎用連想計算エンジン(GETA) は、大量のデータを高速に処理可能な高性能連想検索エンジンである。これを BSD 風のライセンスで自由に使わせてくれている国立情報学研究所は太っ腹なのだが、どうも私にはインストールが敷居が高いように感じられた。最近、最新版である GETA 第3版の作者である西岡真吾特任教授と知己を得たので、突撃インタービューを行い、インストール方法を教わるという幸せな体験をした。 GETA は現在 FreeBSD / Linux / Solaris 等 UNIX 風 OS で動作可能である。MacOSX は?というと今のところはうまくコンパイルできないらしい。私が Linux ユーザーなので、今回のエントリでは主に Linux にインストールする方法を中心に考えてみる。 私がインストールの成功を確認した環境は、"Linux CentOS 4(Linux 2.6.9)" と

    Linux ユーザーのための GETA 第3版インストール方法 - elm200 の日記(旧はてなダイアリー)
  • 1