Livestreaming IT Event and lectures in Japan 日本のIT関連のイベントやセミナーの配信をしています。 by TechWave.jp
![ユビレジ(LaunchPad -IVS 2011 Spring Sapporo-)](https://cdn-ak-scissors.b.st-hatena.com/image/square/ef01aa9525e9db53eda07f2025dd0d6b024472c9/height=288;version=1;width=512/http%3A%2F%2Fstatic-cdn1.ustream.tv%2Fi%2Fvideo%2Fpicture%2F0%2F1%2F14%2F14978%2F14978934%2F1_2670882_14978934%2C640x360%2Cb%2C1%3A4.jpg)
潜在意味解析(せんざいいみかいせき、英: Latent Semantic Analysis、略称: LSA)は、ベクトル空間モデルを利用した自然言語処理の技法の1つで、文書群とそこに含まれる用語群について、それらに関連した概念の集合を生成することで、その関係を分析する技術である。潜在的意味解析とも。 1988年、アメリカ合衆国でLSAの特許が取得されている[1]。情報検索の分野では、潜在的意味索引または潜在意味インデックス(英: Latent Semantic Indexing, LSI)とも呼ばれている。 出現行列[編集] LSA では、各文書における用語の出現を表した文書-単語マトリクスが使われる。これは各行が各単語に対応し、各列が各文書に対応した疎行列である。この行列の各成分の重み付けには tf-idf (term frequency–inverse document frequen
2009/02/01からのアクセス回数 10209 はじめに † 集合知の3章(一部欠損)をGoogleのブック検索 から閲覧することができます。 また、なぜか原書のPDF がアップされています。 オリジナルのソースは、原書著者TobesのページからPCI_Code.zipと してダウンロードできます。 ↑ 日本語の分かち書き † ブロガーのフィードの単語を処理するには、日本語の形態素解析を行う必要があり、 まずはchasenを使うことにします。 ↑ chasenのインストール † chasenは、MacPortを使って $ sudo port install chasen でインストールしました。 python_chasenで、Shift_JISと想定しているため、/opt/local/etc/chasenrcをchasenrc-Shift_JISの内容で 上書きします。 $ cd /o
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く