ブックマーク / data.gunosy.io (28)

  • 最近のニュース記事推薦手法まとめ 〜固有表現の利用から多様性の向上まで〜 - Gunosyデータ分析ブログ

    はじめに 他ドメインと比較したニュース記事推薦の特徴 1. ライフサイクルの短さがもたらすコールドスタート問題 2. 深い言語理解の必要性 3. 明示的なフィードバックの利用の難しさ トピック別ニュース記事推薦手法 記事の人気度合い(popularity)の考慮 概要 既存研究 固有表現(Named Entity)の明示的な考慮 概要 知識グラフと知識グラフ埋め込み 既存研究 リッチな言語表現の利用 概要 既存研究 明示的なユーザーフィードバック・post click指標の利用 概要 既存研究 ユーザーの興味をより正確に捉えるアーキテクチャ 概要 既存研究 今後のチャレンジ おわりに はじめに こんにちは、Gunosy Tech Lab (GTL) Media ML チームの大竹です。Gunosyでは「情報を世界中の人に最適に届ける」というミッションのもと、グノシー・ニュースパス・LUCR

    最近のニュース記事推薦手法まとめ 〜固有表現の利用から多様性の向上まで〜 - Gunosyデータ分析ブログ
    shunk031
    shunk031 2022/10/11
  • リサーチインターンの成果が紆余曲折を経て国際論文誌 Applied Sciences 誌に採録されるまで - Gunosyデータ分析ブログ

    こんにちは。Gunosy TechLab R&D チーム リサーチインターン の北田 (shunk031) です。今回はようやく皆様にお見せできる、可愛い我が子(もちろん研究のことです)について書きます。 今回採録された論文の全体像:広告クリエイティブを最適なタイミングで停止するよう支援する深層学習を元にした枠組みを提案しました。 この度、私と研究開発チームの 関さん で取り組んでいた研究が MDPI 社が発行する Applied Science 誌 という論文誌 (査読付き journal article) に掲載されました。 www.mdpi.com 今回の論文は "Ad Creative Discontinuation Prediction with Multi-ModalMulti-Task Neural Survival Networks" というタイトルで、 配信効果が悪くなっ

    リサーチインターンの成果が紆余曲折を経て国際論文誌 Applied Sciences 誌に採録されるまで - Gunosyデータ分析ブログ
    shunk031
    shunk031 2022/04/15
    Gunosyリサーチインターンの成果が論文誌に採録されるまでの話を書きました。2019年9月から始めた研究で、数多の苦労がありましたがようやく出版できました。研究内容はもちろん、採録までの軌跡を紹介しております!
  • AdKDD & KDD 2021 に参加しました - Gunosyデータ分析ブログ

    こんにちは。 GunosyTechLab の Ads ML チームの村田 (id:marice0819) です。ELDEN RING を PS5 でプレイしたいので PS5 を求めてるこの頃です。 こちらの記事は Gunosy Advent Calendar 2021 の14日目の記事です。昨日の記事は ism-kit さんの「Athena view と Terraform による宣言的データモデリングとレイクハウスへの道標」でした。 今年の8月14日~8月18日にシンガポールで開催されていた KDD 2021 のワークショップである AdKDD に主に参加してきました。この記事では参加レポートとして KDD、AdKDD のアドテク関連の発表を中心にいくつかの研究と Keynote の紹介をしたいと思います。 AdKDD True Post-Click Conversion via Gro

    AdKDD & KDD 2021 に参加しました - Gunosyデータ分析ブログ
    shunk031
    shunk031 2021/12/15
    ML x 広告のワークショップといえば AdKDD ですね!今年の AdKDD も面白いトピックが盛り沢山だったみたいです👀
  • ニュース記事の品質と広告効果の関係についてCIKM2021で発表を行いました - Gunosyデータ分析ブログ

    こんにちは、研究開発チームの飯塚です。11/1~11/5にオンラインで行われた、CIKM2021に発表参加しました。CIKMとはACM International Conference on Information and Knowledge Managementの略称で、機械学習やWebマイニング、情報検索/推薦といったトピックを扱う国際会議の1つです。今年のCIKMも、新型コロナウィルス感染症対策の観点からオンラインで開催されました。Gunosy社として、このCIKMに参加するのは初めてでした。記事では、今回投稿した論文の経緯や概要、ニュースに関する他研究者の発表の一部をご紹介します。 投稿論文 近年オンラインメディアでは、タイトルや画像などを誇張したクリックベイト記事、ユーザーをミスリードするような釣り記事の問題が指摘されています。また、推薦システム側の問題としては、パーソナライゼ

    ニュース記事の品質と広告効果の関係についてCIKM2021で発表を行いました - Gunosyデータ分析ブログ
    shunk031
    shunk031 2021/11/16
    Gunosy から CIKM'21 採択論文!!
  • DEIM2021で一般発表/技術報告とスポンサーを行いました - Gunosyデータ分析ブログ

    こんにちは、研究開発チームの飯塚です。3/1~3/3にオンラインで行われた、第13回データ工学と情報マネジメントに関するフォーラム(DEIM2021)に参加しました。 今年のDEIMは、現地参加と遠隔参加が選べるハイブリッド開催を予定しておりましたが、昨今のコロナウィルス感染症対策の観点から、今年も完全オンラインで行われました。 今回の参加者総数は、オンライン開催ということもあり1099人と過去最高だったようです。 Gunosy社としては、DEIMに2017年から参加しており、5年目の今年はスポンサーとしての協賛と一般発表/技術報告を行いました。 db-event.jpn.org 発表の振り返り 一般発表 ニュースキュレーションメディアデータを用いたユーザのイデオロギーの特定とそのユーザ閲覧行動傾向分析方式 発表は東京財団政策研究所の機械学習チームとの共同研究として行われたものです。 当

    DEIM2021で一般発表/技術報告とスポンサーを行いました - Gunosyデータ分析ブログ
    shunk031
    shunk031 2021/04/02
    ニュース記事の品質が広告消費行動に与える影響の調査、めちゃめちゃ興味深いトピックで今後の発展が楽しみ
  • グノシーのパーソナライズアルゴリズムを刷新した話 (アーキテクチャ編) - Gunosyデータ分析ブログ

    こんにちは。Gunosy TechLab MediaMLチーム所属の桾澤 (@gumigumi4f) です。 前回の記事に引き続き、グノシーのパーソナライズアルゴリズムを刷新した話について、アーキテクチャの部分を説明したいと思います。 前回の記事から読んでもらえると、パーソナライズの全体像が見えるのでおすすめです。 data.gunosy.io パーソナライズに求められるレスポンスタイム アーキテクチャ ユーザーと記事のベクトル生成とデータストアへの保存 ユーザーリクエストに対し適切な記事リストを生成する処理 どれくらい高速なのか おわりに パーソナライズに求められるレスポンスタイム 前回の記事ではモデルの学習方法やオフラインでの実験などをメインに説明してきましたが、オンラインで実際にA/Bテストするときに考えなければいけないのがレスポンスタイムです。 ユーザーに対して完璧にクリック非クリ

    グノシーのパーソナライズアルゴリズムを刷新した話 (アーキテクチャ編) - Gunosyデータ分析ブログ
    shunk031
    shunk031 2021/02/09
  • グノシーのパーソナライズアルゴリズムを刷新した話 (モデル編) - Gunosyデータ分析ブログ

    こんにちは。Gunosy TechLab MediaMLチーム所属の桾澤 (@gumigumi4f) です。 この記事では、弊社で配信しているニュースアプリであるグノシーのパーソナライズアルゴリズムを刷新した話について書きたいと思います。 アーキテクチャの部分まで含めて記事にしてしまうと非常にブログが長くなってしまうので、記事ではリアルタイム性の高い重要なニュース記事についてどのようにレコメンドするかについて注目して述べます。 アーキテクチャの部分についてはブログ後編のアーキテクチャ編にて書きたいと思います。 後編はこちら data.gunosy.io ニュースアプリのパーソナライズ グノシーにおける旧来のパーソナライズアルゴリズムとその課題 グノシーの新しいパーソナライズアルゴリズム オフライン実験とA/Bテスト おわりに ニュースアプリのパーソナライズ グノシーというニュースアプリで

    グノシーのパーソナライズアルゴリズムを刷新した話 (モデル編) - Gunosyデータ分析ブログ
    shunk031
    shunk031 2021/02/08
  • A/Bテストが出来ない場面での因果推論による効果検証 - Gunosyデータ分析ブログ

    記事は、Gunosy Advent Calendar 2020 19日目の記事です。 昨日はサンドバーグさんの Amazon AthenaのPartition Projectionを使ったALB Access Logの実例 (w/ terraform & glue catalog) - Gunosy Tech Blog でした。 こんにちは、GTL(Gunosy Tech Lab) 所属のクボタです。 社内では主にニュースパスというアプリの分析などを行なっています。 記事ではA/Bテストの実施が難しい場面でチームでも利用している因果推論による効果検証について簡単に紹介させていただきます。 はじめに Gunosyではアプリ内でのロジックやUIの変更、キャンペーンなどの施策においてデータに基づく効果検証をしています。 効果検証では分析対象の施策起因による変化である因果効果のみを求めたいです

    A/Bテストが出来ない場面での因果推論による効果検証 - Gunosyデータ分析ブログ
    shunk031
    shunk031 2020/12/21
  • 2020年の研究開発チームの振り返り - Gunosyデータ分析ブログ

    はじめに こんにちは、研究開発チームの関です。 2020年もまもなく終わりを迎えますね。皆さんどんな一年だったでしょうか。 私にとってはアイドルのライブがほとんどなく、生きがいの一つがなくなって辛い一年でした。 オンライン特典会やライブ配信で名前を読んでもらうことを楽しみに生きる日々です。 空いた時間でリアル脱出ゲーム・謎解きに夢中になり、この一年で約40公演に参加しました。 記事は、Gunosy Advent Calendar 2020 16日目の記事です。 昨日はQAチームakinkさんの 歴史と向き合い既存機能の棚卸しをした話 - Gunosy Tech Blog でした。 エントリでは昨年に引き続き今年も研究開発チームの振り返りをしていきたいと思います。 昨年の記事はこちらです。研究開発チームの立ち上げの経緯なども書いているので、まだ読んでいない方はよろしければこちらも合わせて

    2020年の研究開発チームの振り返り - Gunosyデータ分析ブログ
    shunk031
    shunk031 2020/12/17
    この一年もリサーチインターンとして関さんにめちゃめちゃお世話になりました!完全リモートになっても、オフラインのようなスムーズさで研究開発に取り組ませていただいております
  • その実験、再現できますか?pyenvとpoetryによる “そんなに頑張らない” 再現可能な実験環境構築 - Gunosyデータ分析ブログ

    Gunosy Tech Lab リサーチインターンの北田 (@shunk031)です。 深層学習の論文を読んでいるときに著者実装が公開されている旨を見ると嬉しい気持ちになりますよね。 いざ公開レポジトリに飛んだ瞬間その嬉しさは無となることが多いですが、くじけずにやっていきたいです。 著者実装のrequirements.txtをベースにpythonモジュールをインストールするとよく見るやつ こちらの記事は Gunosy Advent Calendar 2020 6日目の記事です。昨日は @625 さんの goで作るfirehoseのデータ変換lambda でした。 tech.gunosy.io その実験、再現できますか? リサーチインターンでは主にGunosyのデータを使った研究をしています。 特に私は深層学習による広告クリエイティブの評価や運用支援に焦点を当てて取り組んでいます*1。 深層

    その実験、再現できますか?pyenvとpoetryによる “そんなに頑張らない” 再現可能な実験環境構築 - Gunosyデータ分析ブログ
    shunk031
    shunk031 2020/12/06
    「著者実装の全然再現しないじゃん!!」「自分の実装、再現しないじゃん!!」よくある話ですね。そういう辛い話の解決を手助けする記事を書きました。他にも様々な方法があると思うのでぜひ教えて下さい。
  • 新卒入社して半年が経ちました vol.3 〜アプリ健全化〜 - Gunosyデータ分析ブログ

    はじめに こんにちは、GTL Media ML チームの谷口(2020新卒)です。記事では、現在私が関わっているプロジェクトの一つである「扇情的な記事の判定」についてお話しします。 現在当社では、中長期的な成長を見込んで、アプリで提供するニュース記事リストの健全化を進めるという方針をとっています(詳しくは東洋経済ONLINEでの当社インタビュー記事をご参照ください)。そして、その方針に沿った複数の施策が行われています。私はその一つである、扇情的な記事を自動で判定してリスト生成に活用するという試みに携わっています。 toyokeizai.net 実際にどのようなことを行ったか 1. 扇情的な記事とはなんなのか、その定義を決める この施策は、 扇情的な記事とは一体何なのか ということを検討するところから始まりました。実際に記事を分析しながら扇情的な記事の分類を定義していきます。ここで難しいの

    新卒入社して半年が経ちました vol.3 〜アプリ健全化〜 - Gunosyデータ分析ブログ
    shunk031
    shunk031 2020/11/19
    アプリ健全化への近道は丁寧な人手アノテーション!
  • 2019年のGunosy研究開発チームの振り返りとこれから - Gunosyデータ分析ブログ

    はじめに こんにちは、研究開発チームの関です。 いつのまにやら年末感が漂ってきましたね。今年もクリスマスは赤レンガ倉庫でカップルたちの中アイドルライブを見て過ごしました。*1 年越しはCDJででんぱ組と年越しを迎えるので、クリスマスも年越しも推しと過ごせて幸せです。 さて、この記事はGunosy Advent Calendar 2019の21日目の記事です。*2 この記事では研究開発チームのこの1年の振り返りと、今後について書いて行こうと思います。 自分なりの整理や、社内広報の役割も兼ねています。 はじめに 2018年までの研究開発 2019年の主な活動 業績 学会・研究会への参加 参加した国際学会(いずれも発表参加) 参加した国内学会・研究会 スポンサーした学会 参加レポート 大学での講義 ウェブ工学とビジネスモデル ウェブサービスにおけるデータ分析機械学習 2019年の振り返り よか

    2019年のGunosy研究開発チームの振り返りとこれから - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/12/26
    関さんと楽しく研究した1年でした!
  • Kaggle Days Tokyo 参加レポート - Gunosyデータ分析ブログ

    はじめに こんにちは!Gunosy Tech Lab の石川(@takaishikawa42)です。 この記事は Gunosy Advent Calendar 2019、12日目の記事です。 昨日の記事は id:mgi さんによるグノシーにおける AWS Transit Gateway 活用事例 でした。 12月11日・12日の2日間の日程で六木の Google Japan のオフィスで開催された Kaggle Days Tokyo に参加してきたので、記事ではそのレポートを書きたいと思います。普段趣味で Kaggle を楽しんでいる身として Kaggle Days が東京で開催されることを知り、前のめりで参加してきました。 当日の様子は Twitter のハッシュタグ #kaggledaystokyo で呟かれており、togetter でもまとめられています。*1 はじめに Kagg

    Kaggle Days Tokyo 参加レポート - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/12/12
    Kaggle Days Tokyo最速参加レポート!
  • ウェブにおけるユーザエンゲージメントを計測・予測する研究について。 - Gunosyデータ分析ブログ

    はじめに みなさんこんにちは、研究開発チームの関です。 先週末はでんぱ組の幕張2daysでしたね。なにを言っても陳腐になってしまうのですが当に素晴らしい2日間でした。 色々素晴らしいことがあったのですが、推しが作った衣装をきた推しが最高に可愛かったのと、アンコールでのみりんちゃんサプライズのときの推しのドSなMCが最高に良かったです。 さてこの記事は情報検索アドベントカレンダーの9日目です。 昨日はh-nagoさんのqiita.comでした。 日の記事ですが、私の推し研究者であるMounia lalmas氏をご紹介したいと思います。 みなさんにも推し研究者いますよね。 彼女は現在SpotifyのResearch Directorです。もともとは米ヤフーで研究をされており、2017年からSpotifyに移られたようです。 ウェブサービスにおけるユーザエンゲージメントに関する研究を数多く行

    ウェブにおけるユーザエンゲージメントを計測・予測する研究について。 - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/12/10
    ウェブエンゲージメント研究のトップランナーが発表している論文が複数を紹介されてて良かった
  • Web Intelligence 2019にFull Paperが採択され、発表をしてきました - Gunosyデータ分析ブログ

    はじめに みなさんこんにちは、研究開発チームの関です。 今年のクリスマスも横浜赤レンガ倉庫で、カップル大量発生の中ででんぱ組さんのライブを見て過ごすことになりそうです。 10/14~17までギリシャのテッサロニキで開催されていたWeb Intelligence 2019 (WI2019)に、 論文がFull Paperとして採択されましたので発表のために参加してきました。 すこし時間が経ってしまいましたが、採択された論文と現地の様子について報告したいと思います。 はじめに 採択された論文について 提案手法 システムアーキテクチャ 採択までのプロセス WSDM2018投稿時 WWW2019投稿時 WI2019投稿時 Web Intelligenceについて 概要 ギリシャのテッサロニキの様子 プログラム まとめ 採択された論文について まずはWI2019に採択された論文について紹介します。

    Web Intelligence 2019にFull Paperが採択され、発表をしてきました - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/11/18
    2度のリジェクトを超えて、ちゃんとクオリティ上げて採択率20%下回るところに通せてるの強い
  • RecSys 2019 参加レポート - Gunosyデータ分析ブログ

    はじめに 推薦システムのトップカンファレンスであるACM主催のRecSys2019 が9月15日から9月20日の間にコペンハーゲンで開催されました。 Gunosyから投稿した論文がshort paperとして採択され*1、関、飯塚の2名でポスター発表してきました。 はじめに Recsysについて タイムテーブル 会議 Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches Online Learning to Rank for Sequential Music Recommendation Recommending What Video to Watch Next: A Multitask Ranking System Relaxed Softma

    RecSys 2019 参加レポート - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/10/11
    Recsys2019参加レポート、今回もボリュームがすごい。
  • A/Bテストのベストプラクティスと落とし穴 ~KDD2019 レポート~ - Gunosyデータ分析ブログ

    はじめに 研究開発チームの関です。古川未鈴さんの結婚、ニジマス大門果琳さんの卒業、uijinの解散とアイドル業界も激動の秋を迎えていますね。 2019年8月4日から5日間、アメリカはアラスカ州アンカレッジで開催されたデータマイニング領域のトップカンファレンスであるKDD2019にGunosyから北田と関が参加・発表してきました。 これまでに2つのレポートを公開しています。 data.gunosy.io data.gunosy.io レポートではTutorialとして開催された「Challenges, Best Practices and Pitfalls in Evaluating Results of Online Controlled Experiments」の内容をレポートします。 内容は現在のA/Bテストのガイドラインと言ってもいい内容で、非常に参考になるポイントが多かったです。

    A/Bテストのベストプラクティスと落とし穴 ~KDD2019 レポート~ - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/10/03
    A/Bテストのチュートリアル大繁盛だったので注目されてる感ありますね
  • 公平性および説明性を考慮した機械学習 in KDD2019 - Gunosyデータ分析ブログ

    研究開発チームインターンの北田 (shunk031) です。アメリカのアラスカにて行われたKDD2019に参加・発表してきました。 www.kdd.org KDD2019 のチュートリアルやワークショップ、キーノートの中でFairness (公平性) および Explainability (説明性) にフォーカスした以下のものを聴講したので概要をまとめたいと思います。 チュートリアル Fairness-Aware Machine Learning: Practical Challenges and Lessons Learned Explainable AI in Industry ワークショップ Explainable AI/ML (XAI) for Accountability, Fairness, and Transparency キーノート Do Simpler Models Ex

    公平性および説明性を考慮した機械学習 in KDD2019 - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/09/25
    #KDD2019 参加ブログ第二弾書きました!昨今注目されているFairnessやExplainabilityといったトピックを中心としたチュートリアル・ワークショップに参加した際のレポートです
  • テンセントの広告技術が未来すぎる!AdKDD2019のテンセントAds招待講演まとめ - Gunosyデータ分析ブログ

    研究開発チームインターンの北田 (shunk031) です。アメリカのアラスカにて行われたKDD2019に参加・発表してきました。 www.kdd.org KDD2019の広告分野のワークショップであるAdKDD2019では、世界を牽引するアドテク企業が複数招待講演を行いました。 www.adkdd.org その中でも Tencent Ads: Interesting Problems and Unique Challengesにおいて、テンセントの広告チーム(テンセント Ads)の取り組みが未来過ぎたため、資料に取り上げられている技術を中心にまとめて報告させていただきます。 特に驚くべきは動画に対して広告対象の商品画像を自動で合成する VideoIn Ads は眼を見張るものがありました。ぜひこの記事を一読していただき、一緒に未来を感じてほしいです (そしてそれ以上のものを作っていきたい

    テンセントの広告技術が未来すぎる!AdKDD2019のテンセントAds招待講演まとめ - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/09/04
    #KDD2019 参加ブログ第一弾書きました!テンセントのAI技術についてまとめています。トップカンファ通しまくってるのも頷ける技術力です
  • 画像の認識・理解シンポジウム (MIRU2019)に参加して来ました! - Gunosyデータ分析ブログ

    はじめに 7/29~8/1の4日間、MIRU2019に参加してきたので、発表の概要とシンポジウムについて紹介いたします。 私達はこれまで人工知能学会、言語処理学会、データベース学会の関連イベントを中心に参加してきました。 それは私達の技術の注力領域がニュース記事の推薦システムであり、 ウェブマイニング、自然言語処理、推薦システムといった学術領域が主な領域だったからです。 しかし、近年私達のサービスでも画像が中心となったニュース記事や、動画コンテンツがサービスの中でも重要度を増してきており、 こうしたコンテンツを「最適に届ける」ために、画像処理技術の導入を進めています。 こういった背景から、画像認識・理解領域における技術のキャッチアップと国内の研究動向の把握を目的として、会社としてはじめて、森と関が参加してきました。 はじめに MIRU2019について チュートリアル講演 Generati

    画像の認識・理解シンポジウム (MIRU2019)に参加して来ました! - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/08/20
    MIRU行ってみたさがより一層深まった