サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大そうじへの備え
geta.ex.nii.ac.jp
汎用連想計算エンジン(GETA)は、文書検索における頻度付き索引データ(どの文書に どの単語が何回出現するというような)を典型とする大規模かつ疎な行列 を対象として、行と行あるいは列と列(具体的には文書間および単語間) の類似度を内積型メジャーで高速計算するツールです。 連想検索をはじめ、文書分類、単語間類似度計算など、大規模文書 の分析に必要な要素技術をサポートすることを目的としています。 GETA: Generic Engine for Transposable Association
Perlインタフェース活用術 ― 連想検索GUIの実現方法 ― 1. はじめに 汎用連想計算エンジンGETAに含まれるPerlインタフェース (以後,WAMモジュールと呼びます) を利用して,以下の機能を有する連想検索GUIを実現する方法について解説します。 フレーズ検索 ユーザが入力した検索要求を検索キーとして関連文書を検索する機能。 文書要約 文書から特徴語 (トピックワードと呼ぶ) を抽出し,抽出した特徴語を検索結果の要約とする機能。 文書連想検索 ユーザが選択した文書を検索キーとして関連文書を検索する機能。 トピックワード検索 ユーザが選択したトピックワードを検索キーとして関連文書を検索する機能。 以下に進む前に,GETAのインストールとコーパスのセットアップを完了させておいて下さい。 2. 準備 2.1 WAMモジュールの読み込み WAMモジュールを使うには, use wam (
はじめにこのチュートリアルでははじめに極めて簡単な WAM ファイルを作り, GETA および WAM の基本構成要素とそのセットアップの方法について学びます. 次に簡単な応用例としてメール検索システムを作ってみます. この文書では, GETA がインストールされているディレクトリを"$GETAROOT"と表記します. GETA のインストールについては Section 1を参照して下さい. Section 1: GETA のインストールSection 2: WAM の基礎Section 3: GETA による電子メール検索システムの製作 3.6 検索インタフェースの製作3.6.1: C 言語プログラミングインタフェースの基礎3.6.2: 日本語形態素解析器と, ci.conf についてもう少し3.6.3: 検索システムの作成
Installation ManualGETA を利用するために必要なリソースについて分散 GETA インストール手順モノリシック GETA インストール手順Tutorial・WAM の基本的な使い方 (libwam) のチュートリアル・連想ライブラリ (libae) のチュートリアル・クラスタリングライブラリ (libcs) のチュートリアル・Perlインタフェース活用術 -- 連想検索GUIの実現方法Appendix・報告されているバグについて・用語一覧・GETA ライブラリが提供する関数一覧 ・クイックリファレンスカード ・GetaBenchGETA 性能定量的評価システム(インストール説明書)・GEMU汎用 freqfile 作成ツール, 高速形態素解析器スイッチ等を含む GETA おまけパッケージ(無保証)・mai-cvtCD-ROM版「毎日新聞」(94年以降)から WAM と「
はじめにクラスタリングプログラムを作るクラスタの代表単語を表示する検索結果を自動分類するクラスタリングアルゴリズムの詳細1 はじめにこのチュートリアルでは,libcs について学びます. libcs は, WAM にエンコードされたデータをクラスタリングするためのライブラリです. クラスタリングとは, 互いに似ているデータを自動的にまとめることです. まとまったデータ集合のことをクラスタと呼びます. 例えば,キーワード検索の結果(文書集合)をクラスタリングすれば, 検索結果を幾つかの意味的なまとまり(クラスタ)に分類することができます. これは検索結果の概観をつかむのに役立つでしょう. その他にも,単語の集合をクラスタリングすれば, シソーラス(単語の意味的な階層)のようなものを自動的に作ることができます. 実際の実行例をみてみましょう. 毎日新聞94年版から社説を10記事選び, 3つの
汎用連想計算エンジンGETA ファミリー 公開 Siteこのページでは, 汎用連想計算エンジンGETA を紹介しています. GETA の実装はいくつかありますが, そのうち公開されているものは現在 2 つあります. 汎用連想計算エンジンGETA ファミリー 公開HP初代 GETA はこちらから配布されています. 最新版は GETA3.2u です.GETAssocGETAssoc は, もうひとつの GETA の実装です. Last Modified Tue Jul 21 14:12 JST 2009
このページを最初にブックマークしてみませんか?
『汎用連想計算エンジン GETA ファミリー』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く