タグ

2010年6月7日のブックマーク (4件)

  • 自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記

    Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。 この分野では Liu Yang によるA comprehensive survey on distance metric learning (2005) が包括的なサーベイ論文として有名なようだが、それのアップデート(かつ簡略)版として同じ著者によるAn overview of distance metric learning (2007) が出ているので、それをさらに簡略化してお届けする(元論文自体文は3ページしかないし、引用文献のあとに表が2ページあって、それぞれ相違点と共通点がまとまっているので、これを見ると非

    自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記
  • 第2回 データベース・プログラミングも簡単

    前回は,IPythonを導入し,簡単なファイル管理のプログラムを作るところまで説明しました。今回はさらに踏み込んで,PostgreSQLを利用してデータベース・プログラミングにチャレンジしてみましょう。 ここでは,SQLObjectというPythonのフレームワークを使います。SQLObjectを使うと,手軽にデータベースを扱うことができます。テーブルにid列が必須という制約がありますが,そうした規約を守っていれば,ほとんど設定無しでデータベースを取り扱うことができるので,小規模なプログラミングにはピッタリです。 前回説明したUbuntuの「日語ローカライズドDesktop CD」で起動した環境で,PostgreSQL 8.2体,データベースへのコネクタ,SQLObjectフレームワークをそれぞれインストールします。コマンドは,以下のようになります。 sudo aptitude -y

    第2回 データベース・プログラミングも簡単
  • dict.get - 初学者の箸置

    昨日のpythonネタで二つとも try: foo[key] += val except: foo[key] = initial みたいなダッサいことしてました。 以下のように書けば foo[key] = foo.get(key, initial) + val 良いんですね。。。こういうとこダメだなあ。しっかりリファレンス読もう。 と、思ったけど これだと 正しくは foo[key] = foo.get(key, initial-val) + val となるのか。何か汚い気がする。 今回の例では問題なさそう。 前: try: ret[name]+= pow except: ret[name] = pow 後: ret[name] = ret.get(name, 0) + pow 前: try: tags[keyword] += 1 except: tags[keyword] = 1 後:

    dict.get - 初学者の箸置
  • 学習ブロック入門編

    next:計画ブロック入門編 >> Next Session:人工無脳の条件 人工無脳はチャットの内容を記憶し、それを再構成することで会話を行なうふりをする。近年では自分が属しているチャットだけでなく、ニュースサイトのテキストなども収集して学習する人工無脳も多い11こうさぎ、酢鶏など。チャットやRSSから得られた文字列を必要な形式で記憶することが学習ブロックの目的である。人工無脳の学習アルゴリズムは文の再構成アルゴリズムと一体になっている場合が多いのだが、あえて切り離して議論することで組み合わせの自由などを考えることができるようになる。そこで、ここでは学習、すなわち入力文字列を記憶に変換するアルゴリズムについてのみ考えよう。 マルコフ連鎖 以前から注目されているアルゴリズムに、C. Shannonによって1948年に発案されたマルコフ連鎖によるテキスト生成(Markov text gene