タグ

researchに関するoverlastのブックマーク (64)

  • レコメンド, LSH, Spectral Hashing - DO++

    WEB+DB press vol.49にレコメンド特集の記事をtkngさんと書きました。 内容は最初は、協調フィルタリングやコンテンツマッチの簡単な話から、特徴量をどのように表すか、大規模データをどのように処理するかにいき、特異値分解などの低ランク行列分解によるレコメンドやRestricted Boltzmann Machineといった最近のnetflix prizeの上位の手法など、かなり突っ込んだ議論もしてます。 個人的には三章でLocality Sensitive Hash(LSH)について扱っているあたりがお勧めです。 レコメンドの内部の問題を極言すると、データというのは疎な高次元の数値ベクトル(数百万次元とか)で表され、クエリでベクトルが与えられた時、これと似たようなベクトルを探してこいという問題になります。”似たような”を数学的にいえば、クエリのベクトルとの内積(各ベクトルは長

    レコメンド, LSH, Spectral Hashing - DO++
  • 「Introduction to Information Retrieval」の輪講始めます

    「Introduction to Information Retrieval」の輪講始めます 2007-12-03-2 [IIR] 「Introduction to Information Retrieval」というがあります。 まだ出版されていないのですがドラフト PDF が入手できます。 - Introduction to Information Retrieval http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html - 言及記事→[2007-01-23-5] 来年1月から、有志でこのの輪講を行います。 基的に私が全体をフォローしますので、 まあ「たつをゼミ」みたいな感じです(ヲゼミ?)。 大学のゼミみたいのをオープンにやるイメージで。 第一回は、 2008年1月12日(土)の12:00-15

    「Introduction to Information Retrieval」の輪講始めます
  • 日本のインターネット人口は「7,361万9千人」

    上図のグラフにあるとおり、昨年より354万7千人増。そのうち、家庭からのブロードバンド利用者数は3,756万8千人。日全世帯におけるブロードバンド普及率は、41.4%。 なお、「勤務先/学校のみ」「携帯電話/PHSのみ」の利用者を除いて、自宅からインターネット利用者がいる世帯の比率は57.3%。 ブログやSNSRSSの認知率などは以下の通り。 インプレスR&D 『インターネット白書2006』発売 家庭からのブロードバンド利用者数 3,756万8千人 前年比116.5% ~ブロードバンド世帯普及率41.4%(2006年2月時点)~ インターネット世帯浸透率と世帯普及率の推移 インターネット利用者の接続場所別・利用機器別構成比 ブログの認知は98.6%(昨年は91.4%)。このうち、「読んでいる」も含めて利用しているのは63.3%。自分のブログを公開している人は25.3%、主に10代、20

    日本のインターネット人口は「7,361万9千人」
  • 検索エンジンの表示結果、最初のページしか見ないユーザーは62% (MYCOM PC WEB)

    米iProspectは、検索エンジンの最新利用事情などを調査したレポート「iProspect Search Engine User Behavior Study」の発表を行った。検索結果の上位に表示されることの重要性が浮き彫りにされている。 同レポートは、米調査会社のJupiterResearchが、米国内の検索エンジンユーザーを対象にして実施した調査に基づくとされる。調査結果によれば、最初のページに表示された検索結果のリンクをクリックするようにしているとの回答者が、全体の62%を占めた。もしも最初のページで探していた情報が見つからなければ、2ページ目以降に表示された検索結果を見ることなく、検索語や検索エンジンを変更して、新たなサーチを行うようにしているとの回答も、全体の41%に上ったという。いずれの回答も、4年前に実施された同種の調査結果と比較して、10ポイント以上は上昇しているとされ