タグ

自然言語処理に関するak7kagekiyoのブックマーク (4)

  • 言語研究者のための統計の学び方―より高度な内容|Colorless Green Ideas

    はじめに 先日、「言語研究者のための統計の学び方―基礎を身につける」という記事で、統計の基礎の学び方を紹介した。そこで紹介したことを学ぶだけでも、結構色々な言語研究ができる。だが、もう少し腰を入れて言語研究をする場合は、統計に関して、より高度な内容を学んでおく必要がある。 今回は、統計の基礎を学び終えた言語研究者が次にどう勉強していけば良いかについて紹介する。 この記事で扱う内容 先日書いた「言語研究者のための統計の学び方―基礎を身につける」という記事では、統計の基礎をどう勉強すれば良いかについて触れた。今回は、より高度な内容を学ぶためにはどうすれば良いかについて紹介したい。図示すると、以下のとおりになるだろう。 言語研究者のための統計の学習順序 上に掲げた図からも分かるように、今回扱う内容は、「コーパス処理向け」・「言語実験向け」・「言語教育向け」の3つに分かれている。このように分けた

  • "Collective Intelligence"のサンプルをrubyに移植してみた - ma2の日記

    Programming Collective Intelligence: Building Smart Web 2.0 Applications 作者: Toby Segaran出版社/メーカー: O'Reilly Media発売日: 2007/08/26メディア: ペーパーバック購入: 3人 クリック: 117回この商品を含むブログ (31件) を見る「集合知」を解説するこのにはいろんな実例とサンプルが出てくる。サンプルは python なので ruby に書き換えてみた。書き換えたのは第二章の "Making Recommendations" の一部です。なんらかのアイテム(とか映画とか)とその評価(Amazonレビューの★とか)を複数の人間が行った場合に,その情報を元に「似た傾向の評価者」を探し,似た傾向の評価者のリストから自分が未評価のアイテム(つまり未読のとか未見の映画とか

    "Collective Intelligence"のサンプルをrubyに移植してみた - ma2の日記
  • 『集合知プログラミング』を Ruby で - ドレッシングのような

    さっそく時間を作って読んでいるわけですが,コードが Python なんですよね.僕は Ruby の人なので Ruby でやりたいなと思っていまして,読みながらその場で同時通訳しています.その過程で Ruby のコードができるわけですが,せっかくなのでココで紹介しますね.現状,2.5 の最後 (p.20) まで読みましたので,それを載っけましょう.ファイル名は recommendations.rb です. まずは p.8 のデータセットです.recommendations.rb は load で読み込むことを前提にしています.Ruby はファイルスコープを持っていて,ローカル変数はファイルの外からは見えません*1.そのため文中の変数 critics は,Ruby では手っ取り早くグローバル変数にしました. # 映画の評者といくつかの映画に対する彼らの評点のディクショナリ $critics

    『集合知プログラミング』を Ruby で - ドレッシングのような
  • 集合知プログラミングが凄すぎる件について - プログラマでありたい

    ようやく集合知プログラミングが届きました。まだ30分くらいざっと目を通しただけですが、これだけは言えます。自然言語処理をテーマとして扱う書籍の中で、実用度No.1です。文句なしにお勧めです。これで3,400円は安すぎます。倍の値段であっても買います。 気に入った点といえば、例えばです。2章「推薦を行う」は、所謂リコメンドエンジンをテーマにしているのですが、この方法に複数のアプローチを紹介しつつ解説しています。レコメンドエンジンの代表的な方法に強調フィルタリングというのがあるのですが、この方法は類似スコアを出す必要があります。スコアの出し方に、ユークリッド距離やピアソン相関などの例を挙げ、それぞれの長所短所を述べています。また相関の種類にもユーザ相関とアイテム相関があり、それぞれどのようなデータの時に向いているのか等を解説してくれています。ですので、複数の手法は知っていてもどちらの方が良いか

    集合知プログラミングが凄すぎる件について - プログラマでありたい
    ak7kagekiyo
    ak7kagekiyo 2009/03/21
    そんなに凄いのか。python出来ないと駄目らしい。
  • 1