タグ

recommendationとnlpに関するttakezawaのブックマーク (3)

  • Richard Wang (王俊晴)

    Ph.D. Thesis Richard C. Wang: Language-Independent Class Instance Extraction Using the Web. In CMU SCS Technical Report Series (CMU-LTI-09-020), 2009. PowerPoint Slides: phd-thesis.ppt Thesis Systems Automatic Set Instance Acquirer (ASIA) Instance Acquisition refers to extracting instances of a given semantic class name (e.g., car makers => Ford, Nissan, Toyota). ASIA extracts set instances by uti

    ttakezawa
    ttakezawa 2009/11/15
    Bayesian Sets似てる (参考:Language-Independent Set Expansion of Named Entities using the Web)
  • PRoxy Diary(2006-09-16) - Bayesian Sets

    _ [コンピュータ] Bayesian Sets何はともあれ一番目立つところにリンクをば。 ここのところちょっと時間が取れたので、以前から気になっていたBayesian Setsを実装してみました。Bayesian Setsは、ある単語を入力すると、それと関係が深い単語を推測して返してくれるというものです。Google Setsというサービスを聞いたことがある方もおられるかもしれませんが、やりたいことはあれと同じです。理論的な話に興味がある場合はここを参照するか、元論文に当たってください。 論文で「高速」と紹介されているだけあって、Wikipediaから17万文書を使って学習させたにも関わらず結構な速度で動いてくれています。辞書に登録されている単語数も44万と豊富。これだけのものを現実的な時間で捌いているというだけでも、かなり驚きです。無理やりアドホックに処理を端折って計算量を減らしている

  • Netflix finishes (and starts) – Machine Learning (Theory)

    I attended the Netflix prize ceremony this morning. The press conference part is covered fine elsewhere, with the basic outcome being that BellKor’s Pragmatic Chaos won over The Ensemble by 15-20 minutes, because they were tied in performance on the ultimate holdout set. I’m sure the individual participants will have many chances to speak about the solution. One of these is Bell at the NYAS ML sym

  • 1