ブックマーク / qiita.com/ysekky (2)

  • 私が機械学習研究をするときのコード・データ管理方法 - Qiita

    はじめに Gunosy Advent Calender 6日目を担当します,Gunosyの関と申します. Gunosyではデータ分析部に所属し記事配信ロジックの開発やログ解析によるユーザ行動分析を主に担当しております. また博士後期課程に在籍しておりウェブマイニングを中心とした機械学習応用の研究の取り組んでおります. エントリではソフトウェアエンジニアとして働く過程で身につけた開発手法を, 自分なりに研究活動に活用しながら得たコード管理に関するノウハウを公開するものです. 研究者向けのコーディング技術については各研究室で伝承されているノウハウはあるものの, まとまった資料やそれに伴う議論などは少ないのが現状であると考えております. そしてその研究室でのノウハウもエンジニアとしての経験の少ない学生や研究者によって作られたノウハウであり, 近年急速に進歩しているソフトウェア開発ノウハウに対し

    私が機械学習研究をするときのコード・データ管理方法 - Qiita
  • Matrix Factorizationとは - Qiita

    Machine Learning Advent Calendarです。 普段はGunosyという会社で推薦システムを作ってます はじめに 推薦システムに関する最近の文献を読むと結構な割合で出てくるMatrix Factorizartion(MF)と呼ばれる手法があります。 ざっくり言うとこの手法は協調フィルタリングにおける次元削減を行うことでよりよい推薦を行おうという手法であり、 Netflix Prize(100万ドルの賞金が賭けられた推薦システムのコンテスト)で最も成果を上げたモデルの一つでもあります。 記事ではこの手法を紹介していきます。 協調フィルタリング まず協調フィルタリングについておさらいしましょう。 あるサービスで3人のユーザが5つのアイテムに対して5段階評価をしたとき、その評価値を以下のようにベクトルで表すことができます。 \vec{user_{1}} = (4, 5,

    Matrix Factorizationとは - Qiita
  • 1