ymym3412のブックマーク / 2020年3月11日

ymym3412 id:ymym3412

2020年3月11日のブックマーク (3件)

レコメンドつれづれ　～第3回レコメンド精度の評価方法を学ぶ～ - Platinum Data Blog by BrainPad
本記事は、当社オウンドメディア「Doors」に移転しました。約5秒後に自動的にリダイレクトします。「レコメンドつれづれ」は、レコメンド手法の概念や実装方法を中心に、レコメンドに関する基礎的な内容から最近流行りの技術まで幅広くご紹介する連載です。第3回は、レコメンドの評価方法について、代表的な評価方法・指標をピックアップしてご紹介します。こんにちは。アナリティクスサービス本部の小田です。レコメンドについて考察していく連載の第3回です。第1回協調フィルタリングのコンセプトを知る第2回協調フィルタリングの実装第2回では、協調フィルタリングの実装を行いました。本連載では今後各種手法を実装しながら比較していく予定ですが、その前にレコメンドの評価について確認したいと思います。といっても、レコメンド全体の評価となるとシステムやユーザビリティの評価など広範にわたりますので、今回はアルゴリズ
ymym3412 2020/03/11
レコメンド

ROC

recommendation

機械学習

評価
リンク
ランク学習と検索結果の精度評価指標 - 人間だったら考えて
この記事はランク学習（Learning to Rank） Advent Calendar 2018 - Adventarの4本目の記事です。この記事は何？前回の記事で、LightGBMを用いたランク学習によるランキングモデルを作りました。 www.szdrblog.info 機械学習モデルを作ったら、次にやるべきことはそのモデルの予測精度を確認することです。 *1 この記事では、ランク学習の予測精度を測る指標として、Mean Reciprocal Rank (MRR)・Mean Average Precision (MAP)・Normalized DCG (NDCG) を紹介します。*2 …といっても、この辺りの予測精度の話は非常に有名なので、解説記事はたくさん出てきます。なのでこの記事では、これらの予測精度にまつわる問題点もちょっとだけ紹介しようと思います。ラベルが0 or 1の2
ymym3412 2020/03/11
検索

精度

NDCG

MAP
リンク
Wikipediaを元にした日本語の名寄せデータセットを作成しました - Sansan Tech Blog
こんにちは、DSOC 研究開発部の奥田です。以前の私のブログ記事ではコーギーの動画を見ていると書きましたが、とうとうコーギーを家族として迎え入れ、現在生後6ヶ月の子犬と暮らしております。さて私たちDSOCでは、SansanやEightの価値を高めるために様々な自然言語処理のタスクに取り組んでおります。例えばニュース記事からの固有表現抽出では、私たちのサービスに特化した固有表現を対象に研究開発しています。その他にも様々あるなかで、特に重要かつ困難とされているものの一つに「名寄せ」というタスクがあります。AIや人工知能と呼ばれるものが発達した現代においても、人間には当たり前にできるタスクが機械には難しいことがまだまだ存在します。今回は、その「名寄せ」というタスクにおける日本語でのデータセットを作成してみました。これをきっかけに、日本語での名寄せというタスクの研究が進み分野が活性化することを
ymym3412 2020/03/11
機械学習

データセット

自然言語処理

NLP
リンク
- 2020年3月13日
- 2020年3月11日
- 2020年3月4日