タグ

2006年12月22日のブックマーク (4件)

  • 相関係数 - Wikipedia

    散布図とその相関係数の一覧。相関は非線形性および直線関係の向きを反映するが(上段)、その関係の傾きや(中段)、非直線関係の多くの面も反映しない(下段)。中央の図の傾きは0であるが、この場合はYの分散が0であるため相関係数は定義されない。 相関係数(そうかんけいすう、英: correlation coefficient)とは、2つのデータまたは確率変数の間にある線形な関係の強弱を測る指標である[1][2]。相関係数は無次元量で、−1以上1以下の実数に値をとる。相関係数が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるという。また相関係数が0のとき確率変数は無相関であるという[3][4]。 たとえば、先進諸国の失業率と実質経済成長率は強い負の相関関係にあり、相関係数を求めれば−1に近い数字になる。 相関係数が ±1 に値をとることは、2つのデータ(確率変数)が線形の関係にある

    相関係数 - Wikipedia
  • 人工知能の話題: 協調フィルタリング

    レンタルビデオ店には非常にたくさんの映画があります.あまりに多すぎてどれが面白いかよくわかりません.そんなとき,面白そうな映画を選んでくれるシステムを推薦システム(recommender system)といいます. この推薦システムには二種類の主な実現方法があります.一つは,好きな監督・俳優・ジャンルなどを決めると,それにあった映画を見つけるという内容に基づくフィルタリング(content-based filtering)という方法です.そして,もう一つがここで紹介する協調フィルタリング(collaborative filtering)です.この映画は面白かったとか,この映画はつまらなかったとかの批評のデータをいろいろな人から集めておき,そのデータを参考にして,面白そうな映画を推薦する方法です. ここでは,協調フィルタリングの一つであるJ.RiedlらのGroupLensの方法(注1)を紹

    人工知能の話題: 協調フィルタリング
  • AIST Today 2004.06 VOL.4-6

    近年、商品、学術文献、Webページなどが膨大に集積されるようになった。そのため、嗜好や要求に合うものを、利用者自身が、膨大なデータの中から見つけだすのが困難になってきている。そこで、利用者の代わりに、嗜好や要求に即したものを見つける推薦システムが開発された。  そのような推薦システムには、検索対象の特徴を利用する「内容に基づくフィルタリング」と、「口コミ」による推薦を自動化した「協調フィルタリング」の二つの手法がある。研究では、後者の手法を改良した。  まず、協調フィルタリングの概略を述べる。この推薦システムには、いろいろな検索対象について、その好き嫌いを多くの人に尋ねた結果を集積したデータベースが事前に用意されているとする。推薦システムは、図1のような手順で利用者Aさんが好みそうなものを推薦する。(1)Aさんは幾つかの検索対象について、その好き嫌いを示すことで、嗜好を提示する。

  • 協調フィルタリングによるリコメンデーション

    潜在的な顧客にいかにその人が欲しい商品を勧めるかは広告主にとって重要な要素である。この手法はインターネットユーザのサイト閲覧履歴やクリック履歴などをもとにユーザの嗜好パターンを学習し、そのユーザが好みそうな商品を推薦するための一般的な手法である。 この手法では、複数のユーザのサイト閲覧履歴データを用いる。図1は、縦軸をユーザ、横軸をWebページとして、履歴のうちどのユーザがどのWebページをクリックしたかを表している。「1」はクリックしたことを表し、「0」はそうでないことを表す。ここで、データの埋まっていない部分について、他人のデータを用いてその人の嗜好を予測するのが手法である。 このような協調フィルタリングの手法はいくつかあるが、代表的なのが相関係数法である。これは、ユーザAとユーザBの嗜好パターンに高い相関性がある場合に、ユーザAがクリックしたサイトXをユーザBに推薦するという方法で