2011年6月8日のブックマーク (1件)

  • PHPで2つの文章の類似度を計算する(Yahoo!版)

    サンプル・プログラムの流れは、「PHP形態素解析を行う」と「PHPで2つの文章の類似度を計算する(KAKASI版)」を組み合わせただけなので、ここでは省略する。 なお、「日形態素解析Webサービス」を利用するためには、アプリケーションIDを取得する必要がある。入手方法は「Yahoo!JAPAN デベロッパーネットワーク - 各種WebAPIの登録方法」を参照されたい。 取得したIDは定数 YAHOO_APPLICATION_ID に格納すること。 「PHPで2つの文章の類似度を計算する(KAKASI版)」と同じテキストを使って実行してみよう。 まず、「元のテキスト」として、以下のWikipediaの引用文を入れる。これは「PHP: Hypertext Preprocessor」からの抜粋である。 PHP: Hypertext Preprocessor(ピー・エイチ・ピー ハイパーテキ

    tyam001
    tyam001 2011/06/08
    Yahooの形態素解析Webサービスを利用して、2つの文章の類似度を計算する方法。別ページには、KAKASIを使うバージョンやN-gramを使うバージョンもある。