タグ

algorithmとRに関するxiangzeのブックマーク (4)

  • RでWAICを強引に計算させてみた - motivicのチラ裏

    "R Advent Calendar 2013" 13日目の記事です。 どうも、13日の金曜日に記事を書くことになった幸運の持ち主のmotivicです。 先日WAICについてJapan.RでLTをしたので、まずはこちらをご覧ください。 RでWAIC from motivic ということで、WAICスゴイ!早速Rで強引に計算してみましょう。 渡辺先生のmatlabのコードはこちらから辿れます。 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/dicwaic.html 以下のRのコードはこれの昔のバージョンのものを翻訳したものです。ここでは混合分布のdelicate caseのWAICを計算しています。 研究室の高スペックなコンピュータでも計算するのに37分かかったので、普通のパソコンだと計算に数時間かかるかもしれません。 #T

    RでWAICを強引に計算させてみた - motivicのチラ裏
  • Earth Mover's Distance (EMD) - 人工知能に関する断創録

    Earth Mover's Distance (EMD) について調べたことを整理しておきます。EMDは、ユークリッド距離のような距離尺度の一つで、二つの分布の間の距離を測ることができます。言語処理ではあまり聞いたことなかったのですが、画像処理や音声処理では比較的有名な距離尺度のようです。 EMDが使える問題設定は下図のようになります。 EMDは特徴量と重みの集合(シグネチャと呼ぶ)で与えられる分布Pと分布Qの間の距離です。ここで、特徴量間では距離 が定義されているのが前提です。特徴量がベクトルのときはユークリッド距離、特徴量が確率分布のときはカルバック・ライブラー距離(情報量)などです。EMDは、特徴量の集合が2つ与えられたときに、1個1個の特徴量間の距離をもとに、特徴量集合間の距離を求められるんですね。これはすごい。 重みは具体的な応用によって使い方が変わりますが、その特徴量の重要度を

    Earth Mover's Distance (EMD) - 人工知能に関する断創録
  • https://yogi.bz/~suzu/wp3/?p=266

  • 多次元尺度法で遊んでみる(オレ流 R入門) - ダウンロードたけし(寅年)の日記

    多次元データをクラスタリングする際に、それらのデータを2次元データに落とし込んで可視化させたいことがあります。そんな時に便利なのが「多次元尺度法」という手法です。 個々のデータ間の距離/類似度が分かっている場合に、それらのデータの座標を求めて、データ構造を復元するようなものです。 詳しい説明は割愛します。知りたい人はwikipediaと金先生の連載を読んで下さい。 体で覚えるタイプなので、とにかく何かデータを処理してみます。 「山手線」の地図を再現 さっそく試してみます。 山手線の各駅同士の直線距離を測っておいて、そのデータから実際の位置関係を復元できるか実験してみます。 山手線全駅の距離を測るのはめんどいので、適当に抜粋してしらべました。 以下のような表になりました。単位はメートルです。 さてさて、この距離表からどのようなデータ構造が再現されるでしょうか? このデータを統計解析ソフトRで

    多次元尺度法で遊んでみる(オレ流 R入門) - ダウンロードたけし(寅年)の日記
  • 1