タグ

形態素解析に関するasmblrのブックマーク (3)

  • ベクトル空間法を利用した類似度計算

    ベクトル空間法を利用した類似度計算 澁谷 翔吾, 廣安 知之, 三木 光範 ISDL Report  No. 20081110002 2008年 5月 22日 Abstract 1  はじめに 近年, 異なる文書間の類似度を定量的に計る手法が盛んに研究されている. レポートでは, ベクトル空間モデルを用いることにより, それぞれの文書のベクトルを比較することにより類似度を定量的に計る手法について調査した. 報告では, それらの手順について解説する. 2  形態素解析 形態素解析(Morphological Analysis)とは, コンピュータ等の計算機を用いた自然言語処理の基礎技術の1つであり, かな漢字変換等にも応用されている. 対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を情報源として用い, 自然言語で書かれた文を形態素

  • Windows上で形態素解析Sen - なぜか数学者にはワイン好きが多い

    有名な形態素解析ソフトであるChaSenのJava移植であるSenを必要に迫られてWindowsに入れていたのですが,最近はあんまりメンテされていないらしく(がんばれ,工藤君),いろいろトラブルがあったので後々のために目盛っておきます. JavaのSDKはインストールされてるとします. 環境変数の設定として,コントロールパネル→詳細設定→環境変数で,以下を設定する. Pathに{Antを展開したフォルダ}\binを追加 ANT_HOMEに{Antを展開したフォルダ}を設定 JAVA_HOMEにjdkがあるフォルダを設定 Senの辞書メンテに必要なApache Antをダウンロード,インストールする. http://ftp.riken.jp/net/apache/ant/binaries/apache-ant-1.7.1-bin.zip 同じく必要な,ActivePerlをインストールする.

    Windows上で形態素解析Sen - なぜか数学者にはワイン好きが多い
  • Sen - 日本語形態素解析システム

    Sen は Java で書かれた日形態素解析システム。 C++ で開発されている MeCab を Java に移植したもの。 辞書は MeCab、茶筌と同じIPAの辞書を利用。 Sen配布ページ 辞書の構築に Apache Ant が必要。 このページは Sen version 1.2.2.1 用である。 インストール Apache Antのインストール Sen は辞書を構築するのに Apache Ant というビルドツールを使う。 これをあらかじめインストールしておく必要がある。 Apache Ant のインストール Senのインストール パッケージはSen配布ページから sen-1.2.2.1.zip をダウンロードしておく(mirror)。以下では ~学籍番号/Desktop/ にダウンロードしたものとして話を進める。 展開 /usr/local に展開し、ディレクトリ名を se

  • 1