タグ

algorithmに関するt_ashulaのブックマーク (22)

  • [を] 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード

  • アルゴリズムのはなし

    アルゴリズムのはなし     Last modified: Jul 20, 2004 アルゴリズムのお話をしようと思います。自然言語は,曖昧さが多く,アルゴリズムを記述するのは不適切です。そこで,以下の理由から,awk を使おうと思います。 処理系がフリーウエアである。 各種マシンに移植されている。 機能的には十分で,C 言語に移植しやすい。 警告:以下に示すプログラムは,完全なものでない場合があります。ユーザが自由に書き換えて使うための下書きとして提供するものです。 目次 マン・ホイットニーのU検定の統計量の分布 ウィルコクソンの符号付順位和検定の統計量の分布 ケンドールの順位相関係数の分布 スピアマンの順位相関係数の分布 統計関数の確率の計算 ・正規分布 ・カイ二乗分布 ・t分布 ・F分布 統計関数のパーセント点の計算 ・正規分布 ・カイ二乗分布 ・t分布 ・F分布 Fisher の正