タグ

2011年6月20日のブックマーク (2件)

  • Tsujii Lab. Enshu3 -- Latent Semantic Analysis (LSA)

    Latent Semantic Analysis (LSA) 目次 背景 課題の流れ 背景 近年、情報検索が非常に重要となる一方で、その検索手法は未だにキーワード入力によるものが事実上標準となっています。しかし単語には同義語や、多義語が存在するために目的とする結果がなかなか得られない場合があります。例えば、木を用いたデータ構造を検索しようとして、treeと入力しただけでは目的のものが得られず、tree data structureでようやく狙った検索結果が上位に来ます(多義語の例)。 全ての単語に対し、どの単語同士が似た意味を持っているのか、または持っていないのかを調べることで、より柔軟性をもった情報検索ができる可能性があります(例えば、キーワードに「東大」としか入力していないのに検索結果では「東京大学」「最高学府」「University of Tokyo」が含まれる文書も検索できる)。

  • Pythonでカルマンフィルタを実装してみる

    カルマンフィルタは、時間変化するシステムの、誤差のある離散的な観測から現在の状態を推定する手法。Wikipediaの記事(カルマンフィルター)がわかりやすい。 状態方程式と観測方程式が次のように与えられているとき (状態方程式) (観測方程式) (ノイズ) (フィルタ分布)線形カルマンフィルタ(LKF; Linear Kalman Filter)は μt, Σt, ut, yt+1 を入力として、 μt+1, Σt+1を出力する。1ステップのプロセスは以下のとおり。 # prediction (現在の推定値) (現在の誤差行列)# update (観測残差) (観測残差の共分散) (最適カルマンゲイン) (更新された現在の推定値) (更新された現在の誤差行列)観測を得るごとにPredictionとUpdateを繰り返すことで、現在の状態を推定します。 導出は後述(予定)。 例題を。 2次元