タグ

バンディットに関するhirokistのブックマーク (4)

  • 多腕バンディット入門:3つのアルゴリズムをpythonで実装する

    概要 記事では多腕バンディット問題の概説と、多腕バンディット問題に対する以下の3つの代表的なアルゴリズムをpythonによる実装とともに紹介します。 \epsilon-greedy Upper Confidence Bound Thompson Sampling 最後にそれぞれのアルゴリズムの簡単な比較実験を行います。 ※この記事はこちらに加筆修正を加えたものです。元記事は非公開にしてます。 多腕バンディット問題 いくつかのアーム(スロット)があります。 アームを引くと確率的に報酬がもらえます。ここでは各アームiを引くと確率p_iで1の報酬がもらえ、1-p_iで報酬がもらえないものとします。p_iはアーム毎に異なります。アームを引く人はp_iを知りません。T回アームを引くとき、なるべく多くの報酬をもらいたい、というのが問題設定です。p_iが大きいアームをいかに早く見つけるか、が鍵になりそ

    多腕バンディット入門:3つのアルゴリズムをpythonで実装する
  • Pocochaにおけるバンディットアルゴリズムの検証 | BLOG - DeNA Engineering

    はじめに はじめまして。9月から10月にかけてAIスペシャリストコースのインターンシップに2週間参加させていただいた田邊拓実です。大学では強化学習のロバスト性に関する研究をしています。 今回のインターンシップでは、Pococha(ポコチャ)におけるライバー推薦に取り組んでいました。 以下はブログの概要です。 Pocochaのライバー推薦問題をバンディット問題として定式化しました。 事前にリスナーをセグメントに分割することで、より効果的なライバーの推薦をできるようにしました。 新規ユーザを対象とした問題設定でバンディットアルゴリズムを適用しました。 Pocochaについて https://www.pococha.com/ja-jp 今回のインターンシップでは「Pococha1」と呼ばれるライブコミュニケーションアプリを取り扱いました。ここではPocochaについて簡単に説明をしていきます。

    Pocochaにおけるバンディットアルゴリズムの検証 | BLOG - DeNA Engineering
  • バンディットアルゴリズム入門と実践

    Tokyowebmining発表用資料です。複数の選択肢がある場合に、どのように選択を行うのが効率的なのか?という問題を解決するためのアルゴリズムです。

    バンディットアルゴリズム入門と実践
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
  • 1