ブックマーク / tech-blog.fancs.com (2)

  • Rで学ぶ推薦システム - FANCOMI Ad-Tech Blog

    こんにちは、サービス開発部 情報科学技術研究所の h_shinです。 Rで学ぶ推薦システム(recommendation system)について記事を書きたいと思います。 推薦システム(recommendation system) User-based Collaborative Filtering Item-based Collaborative Filtering とりあえず結果を見る Rソースについて 類似度評価方法の紹介 Euclidean distance(ユークリッド距離) Cosine similarity(コサイン類似度) Pearson correlation(相関係数) 推薦システム実装 評価データ生成 missing valueの問題点 類似度を求める関数作成 user-based collaborative filtering item-based collabor

    Rで学ぶ推薦システム - FANCOMI Ad-Tech Blog
    call_me_nots
    call_me_nots 2017/04/27
    “実験に基づいた評価では、Pearson coefficient が全般的に精度がいいと言われてます。 Cosine similarityはitem-based collaborative filteringで精度がいいと言われてます”
  • CTR予測とAdaGrad - FANCOMI Ad-Tech Blog

    こんにちはデータサイエンティストのt_sakaiです。 前にCTR予測についての概論・評価方法についての記事を書きましたので、今回はさらに踏み込んだ内容についてまとめてみたいと思います。 この記事を読むには以下を理解している必要があります ロジスティック回帰の目的関数 勾配降下法 目的関数と最適化アルゴリズム 基ですが機械学習は、達成したい目的を数値化した目的関数と、目的関数を最小(or 最大)にするための最適化アルゴリズムの2ステップに分けられます。 1つ目のステップの目的関数は、CTR予測においてはロジスティック回帰がデファクトスタンダードになっています。(参考: GoogleのCTR予測についての論文) (kaggleにおけるCriteoのCTR予測コンペでは、特徴量抽出のためにGBDTを使ったり、特徴量の掛け合わせを考慮するためにFFMを使ったりすることにより良い精度が出ることが

    CTR予測とAdaGrad - FANCOMI Ad-Tech Blog
    call_me_nots
    call_me_nots 2017/02/09
    “ロジスティック回帰のモデルをSGDで更新する場合、出現した特徴量の重みのみが更新されるため、SGDではCTR予測のような非常にスパースなデータに対して高速に学習することができる”
  • 1