先日、慶應SFCの清木先生が研究室に来られて、共同で行っているプロジェクトの打ち合わせをしました。 清木先生の研究室では感性に基づく検索というのを研究されていて、たとえば「暖かい音楽」と入力すると、音楽データベースの中から実際に暖かい感じの音楽を見つけてきてくれる。かなりよくできています。 これは清木先生が10年くらい前に提唱した意味の数学モデルというのが元になっているそうです。すなわち、あらゆる検索対象を2,000次元の意味空間にマッピングしておき、クエリからの距離が近いものを検索結果として返すという仕組み。 なぜ2,000次元かというと、元になっているデータがロングマンの英語辞書だそうで、これはすべての語を2,000個の基本語彙で定義することを試みている。もちろん、個々の基本語彙が意味的に直交しているという保証はないので、あらかじめ相関行列に対する固有ベクトルを求めておく。 意味の数学
サポートベクターマシン(以下 SVM) とは ・ニューラルネットワークの一種 ・教師ありクラスタリング SVM の基本的な考え方 ・元々2クラスの線形分離手法として提案される ・単層パーセプトロンに似ているが、SVM はマージン最大化という手法をとっているのがポイント。 ・マージン最大化とは、超平面と学習データの隙間となるマージンをなるべく大きく取ろうというもの。 (ここでいう超平面とは、2つのクラスにぶった切る平面のこと) ・ちなみに超平面と、ちょうどマージンの分だけ離れている学習データをサポートベクトルという。 ・このマージン最大化という考えを取り入れることによって、テストデータの識別精度を高めている。 SVM の発展 ・線形分離不可能な問題への対応 - ソフトマージン(学習データが多少マージンにくい込んだり、反するクラスの空間にくい込んだりしても許す)で対応
最近よく巷で耳にするモノ. SVM, Support Vector Machine, さぽーとべくたーましん. これっていったい,どんなもんなんでしょう. なにやら便利そうなモノらしいので,ちょいと調べて要点をまとめてみようかな,なんて. でも,ただまとめただけだとそのへんの記事を読むのとなんにも変わらないので, コーディングするために必要な知識を中心にまとめてみることにします.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く