タグ

データマイニングに関するnaoyesのブックマーク (2)

  • 「精度高すぎ」と話題のニュースキュレーション『Gunosy』は、どんな設計思想で作られているのか? - エンジニアtype | 転職type

    2012.12.17 転職 ここ最近、個人の関心や嗜好に合わせて情報を紹介するキュレーションサービスが人気だ。Amazonのような大手ECサイトで利用が進む「レコメンド」や「キュレーション」技術を情報配信分野に応用したサービスだが、このカテゴリーの中で、特に注目を集めているサービスがある。 それが、現役東大大学院生3人が立ち上げた『Gunosy(グノシー)』だ。 自らを「スマートなパーソナルマガジン」と命名している『Gunosy』 人気を集めている理由は、その手軽さと推薦情報の的確さにある。 ユーザーが『Gunosy』を利用するにあたって唯一すべきことは、最初にFacebookもしくはTwitterのアカウントを利用してサービスサイトにログインすることだけ。 あとは『Gunosy』独自のレコメンドエンジンが、過去にユーザーがポストした投稿内容の傾向やソーシャルグラフ内でのアクティビティを分

    「精度高すぎ」と話題のニュースキュレーション『Gunosy』は、どんな設計思想で作られているのか? - エンジニアtype | 転職type
  • 芸能人の相関関係を探ってみるスクリプト - download_takeshi’s diary

    ちょっとした実験をしてみました。芸能人の相関関係を機械的に探索してみます。 具体的には「○○というタレントと関係が深い芸能人は?」といった、芸能人にフォーカスした類似検索みたいな実験です。 技術的には「潜在的意味インデキシング」(Latent Semantic Indexing)といった手法を使います。 これは普通は自然言語処理の世界で使われるテクニックですが、なにも言語だけでなく他のデータ素材でも面白い結果が得られるかもしれないので、やってみようという試みです。 以下に大まかな手順をまとめます。 wikipedia から有名人のリストを抽出 それらの有名人リストについて、一人ずつ「誰と関連が深いか」を集計。具体的には有名人個々のwikipediaのページ中に、先ほど抽出しておいた人名リストとマッチする人名がどれだけ掲載されているかをピックアップしていきます。 上記の方法で有名人の間の相関

    芸能人の相関関係を探ってみるスクリプト - download_takeshi’s diary
  • 1