alcusのブックマーク - はてなブックマーク

2019年のGunosy研究開発チームの振り返りとこれから - Gunosyデータ分析ブログ

はじめにこんにちは、研究開発チームの関です。いつのまにやら年末感が漂ってきましたね。今年もクリスマスは赤レンガ倉庫でカップルたちの中アイドルライブを見て過ごしました。*1 年越しはCDJででんぱ組と年越しを迎えるので、クリスマスも年越しも推しと過ごせて幸せです。さて、この記事はGunosy Advent Calendar 2019の21日目の記事です。*2 この記事では研究開発チームのこの1年の振り返りと、今後について書いて行こうと思います。自分なりの整理や、社内広報の役割も兼ねています。はじめに 2018年までの研究開発 2019年の主な活動業績学会・研究会への参加参加した国際学会（いずれも発表参加）参加した国内学会・研究会スポンサーした学会参加レポート大学での講義ウェブ工学とビジネスモデルウェブサービスにおけるデータ分析と機械学習 2019年の振り返りよか

alcus 2019/12/26

あとで読む

リンク

RecSys 2019 参加レポート - Gunosyデータ分析ブログ

はじめに推薦システムのトップカンファレンスであるACM主催のRecSys2019 が9月15日から9月20日の間にコペンハーゲンで開催されました。 Gunosyから投稿した論文がshort paperとして採択され*1、関、飯塚の2名でポスター発表してきました。はじめに Recsysについてタイムテーブル本会議 Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches Online Learning to Rank for Sequential Music Recommendation Recommending What Video to Watch Next: A Multitask Ranking System Relaxed Softma

alcus 2019/10/11

あとで読む

リンク

A/Bテストのベストプラクティスと落とし穴 ~KDD2019 レポート~ - Gunosyデータ分析ブログ

はじめに研究開発チームの関です。古川未鈴さんの結婚、ニジマス大門果琳さんの卒業、uijinの解散とアイドル業界も激動の秋を迎えていますね。 2019年8月4日から5日間、アメリカはアラスカ州アンカレッジで開催されたデータマイニング領域のトップカンファレンスであるKDD2019にGunosyから北田と関が参加・発表してきました。これまでに2つのレポートを公開しています。 data.gunosy.io data.gunosy.io 本レポートではTutorialとして開催された「Challenges, Best Practices and Pitfalls in Evaluating Results of Online Controlled Experiments」の内容をレポートします。内容は現在のA/Bテストのガイドラインと言ってもいい内容で、非常に参考になるポイントが多かったです。

alcus 2019/10/04

あとで読む

リンク

公平性および説明性を考慮した機械学習 in KDD2019 - Gunosyデータ分析ブログ

研究開発チームインターンの北田 (shunk031) です。アメリカのアラスカにて行われたKDD2019に参加・発表してきました。 www.kdd.org KDD2019 のチュートリアルやワークショップ、キーノートの中でFairness (公平性) および Explainability (説明性) にフォーカスした以下のものを聴講したので概要をまとめたいと思います。チュートリアル Fairness-Aware Machine Learning: Practical Challenges and Lessons Learned Explainable AI in Industry ワークショップ Explainable AI/ML (XAI) for Accountability, Fairness, and Transparency キーノート Do Simpler Models Ex

alcus 2019/09/30

あとで読む

リンク

Gunosyでのデータ分析　新卒編 - Gunosyデータ分析ブログ

はじめにこんにちは、今年の4月に新卒として入社しグノシー事業部に配属されました齊藤です。自分は現在グノシー事業部でグノシー（アプリ）の分析を専任しています。データ分析部の方はニュースパスやオトクル等複数のアプリを横断的に分析、ロジック開発を担当しています。今回は各アプリの分析担当がどんなことをやっているのか、2ヶ月間どのような事を学んだかを新卒エンジニアの立場から紹介していこうと思います。もう働き始めてから2ヶ月経ったのか・・・分析分析とだけ書くとやたら広い意味になりますが、主にプロモ指標などを作成、集計し部署の人が見やすい形に整えたり、キャンペーンや特集タブに関する集計、UI変更時のA/Bテスト*1などを行っています。RedashでSQLクエリを書いて可視化したり、以下の記事のようにGASでSlackへの通知を作ったりすることもあります。 data.gunosy.io 分析業務

alcus 2019/06/17

あとで読む

リンク

データ分析部で一年仕事をしての学び - Gunosyデータ分析ブログ

こんにちは、去年の4月に新卒としてGunosyに入社し、データ分析部に配属された山田です。先日、LabBase様からインタビューを受けてこんな記事が公開されたりしました。 labbase.jp また、先週は今年の新卒の片木くんがデータ分析部で何をやっているのかを書いてくれました。 data.gunosy.io 今年は新卒エンジニアの数が多かったので研修がかなり充実しているのですが、去年は新卒エンジニアが僕一人だったのでそのあたりの内容は実際に仕事をしながら学んでいくことになりました。そこでこの記事では、データ分析部に配属されて一年仕事した上で学んだことを軽く紹介したいと思います。数値を疑うこと実行速度は思ったよりもシビアだった大規模データの扱いおわりに数値を疑うこと Gunosyの方針を示す「Gunosy Way」の一つに「数字が神より正しい*1」という言葉があり、実際に社内

alcus 2019/05/31

あとで読む

リンク

言語処理学会第25回年次大会(NLP2019)に一般発表とスポンサーで参加しました - Gunosyデータ分析ブログ

こんにちは、研究開発チームの関です。でんぱ組.incの推しである相沢梨紗さんと、妄キャリの推しだった桜野羽咲さんのコラボユニットが本格的に活動を開始しました。生きてるといいことありますね。ステージ上の目のやり場に困っています。今回3/12 ~ 3/15に名古屋大学で開催された言語処理学会第25回年次大会に一般発表とスポンサーとして参加しました。言語処理学会年次大会へのスポンサーは今年で4年目になりますが、一般発表は初めてになります。（昨年は論文賞をいただき、招待講演をさせていただいておりました。） data.gunosy.io 一般発表一般発表では、Gunosyで研究開発チームでインターンをしている北田 (shunk031) が「広告クリエイティブ自動生成にむけたマルチタスク学習とConditional AttentionによるCVR予測」という題目で発表を行いました。予稿はこ

alcus 2019/04/05

あとで読む

リンク

社内技術ブログのはじめかた - Gunosyデータ分析ブログ

はじめにきっかけ執筆計画を立てる 1. 分析に興味がある人のペルソナを書く 2. 1が検索するであろうクェリの一覧をつくる 3. 検索ボリュームしらべる 4. カテゴリ分け 5. 作るべき記事のリスト（記事タイトルまでだいたいきめちゃう）をつくる 6. 記事を書く担当者とスケジュール引くおまけおわりにはじめにこんにちは。グノシー事業部の大曽根です。好きな曲はザ・ディランⅡの「男らしいってわかるかい」です。この記事はGunosy Advent Calendar 2018の12日目の記事です。昨日はhongmhoonさんのiOSでNotificationを非同期で送ろうでした。最近、プライベートや採用面談などで「会社で技術ブログなどを書きたいけど始められない (or 始めたけど続かない)」という相談を受けるので、弊ブログが如何にして立ち上がったかをまとめたいと思います。 ※本

alcus 2018/12/13

あとで読む

リンク

A/Bテストよりすごい？はじめてのインターリービング - Gunosyデータ分析ブログ

はじめにこんにちは。メディアデータ分析部の飯塚(@zr_4)です。弊社では現在、複数のニュース形式のアプリケーションを運用しており、各プロダクトでユーザーの趣向にあうような記事リストのパーソナライズを行っています。左から：LUCRA、ニュースパス、グノシーそのため、記事のランキングに関するA/Bテストをする機会が多々あり「少数のユーザーで高速に有力なパラメータを探したい」というニーズがありました。今回は上記ニーズを満たすべく、グノシーの本番環境に導入したインターリービングを紹介します。インターリービングとは概要インターリービングは高感度なランキング評価手法です。実験的に、10倍から100倍従来のA/Bテストよりも効率的であることが知られています。*1 従来のA/Bテストにおいて、2つのランキングリストを評価する際は、ユーザを2つの群に分け各々に別々のランキングリストを提示

alcus 2018/10/15

リンク

Facebookの予測ライブラリProphetを用いたトレンド抽出と変化点検知 - Gunosyデータ分析ブログ

Gunosyデータ分析部アルバイトの五十嵐です。 Gunosyには大規模なKPIの時系列データがあります。今回はKPIの時系列分析を行なった際に得た知見についてまとめたいと思います。具体的にはFacebookが開発した時系列予測ツール Prophetを用いて、KPIのトレンド分析を行いました。時系列予測について Prophetについて実装例モデルの適用将来のアクセス数予測トレンド性と周期性の抽出変化点抽出 Slackを利用した自動化まとめ時系列予測について以前、 KPIのトレンド抽出について以下のブログで紹介しました。 data.gunosy.io ここでは時系列データをトレンド成分と季節成分に分解し、トレンドの把握を容易にする分析を行なっていました。 KPIのトレンドを知ることでサービスの状態を把握することが目的でした。今回はこの分析をさらに進め、トレンドの変化点

alcus 2018/02/16

あとで読む

リンク

プロダクト改善のためにウォッチしておくべき7つの指標 - Gunosyデータ分析ブログ

データ分析部でグノシーというニュースアプリのプロダクト改善を担当している @ij_spitz です。今回はプロダクト改善のためにウォッチしておくべき7つの指標をSQLで算出してみます。 Gunosyではこれらの指標を、プロダクトに異常があった時に検知するため、また施策の効果検証といった主に2つの目的で使用しています。簡潔にするため、ユーザーとログインの2つのテーブルを使った算出できる指標のみを対象としています。また、これらの指標をどうやってプロダクト改善に役立てているのかということも少しではありますが、合わせて書いていきたいと思います。 DAU WAU(MAU) HAU 積み上げHAU 1ユーザーあたりのログイン回数登録N日後継続率登録日別N日後継続率前提今回のブログで紹介するSQLはAmazon Redshift上で動くSQLなので、MySQLやGoogle BigQuer

alcus 2017/07/04

運用

リンク

「これからの強化学習」1章の内容で三目並べ - Gunosyデータ分析ブログ

こんちくわ。データ分析部兼サウンドエンジニアの大曽根です。最近は吾妻光良&The Swingin Buppersのライブに行きました。今回は4/12に開催した「これからの強化学習」の輪読会の1.3節で紹介した価値反復法のアルゴリズムを、教科書とは異なる例で実装してみました。開催報告については下記のブログをご覧ください。 data.gunosy.io メジャーなゲームである三目並べを、1.3節にて紹介されているSarsaを用いて学習しました。教科書とは別の例で実装することで少しでも理解が深まればと思います。価値反復に基づくアルゴリズムマルコフ決定過程において価値関数を特定の更新式に従って更新する手法です。(今回はSarsaで試しました。) 発表の際には、tの状態の更新式に次の状態 t+1が含まれているところなどがわかりづらいとの質問を受けました。価値反復に基づくアルゴリズムでは過

alcus 2017/06/14

リンク

Amazon AthenaをBigQueryと比較してみた

こんにちは、データ分析部の阿部です。作業中音楽は聞かない派ですが、ホワイトノイズを聞いていると集中できるという噂を聞いたことがあるので少し気になっています。今回は、re:Invent2016で発表されたばかりのAthenaを紹介します。 Athenaとはデータの準備テーブル作成速度測定まとめ Athenaとは本日、AWSのre:Invent中で、RedshiftやEMRに続くビッグデータサービスとして、Athenaというサービスがリリースされました。 Athenaは、S3上のデータ（CSV, JSON, その他フラットファイル）に対して、インタラクティブにSQLを実行することができます。 RedshiftやEMRに比べて、クラスタの構築や運用を必要とせず、シンプルにクエリを実行できるというメリットがあります。課金形態も、クエリ&読み込んだデータ量に応じて課金という点で、Go

alcus 2016/12/01

Database

リンク

いまさら聞けない機械学習の評価関数 - Gunosyデータ分析ブログ

アライアンス事業開発部の大曽根(@dr_paradi)です。ニュースパスというアプリの分析と開発を行っております。今回は機械学習の評価関数のお話をします。内容は、【FiNC×プレイド】Machine Learning Meetup #1 - connpassで発表したものになります。発表資料いまさら聞けない機械学習の評価指標 from 圭輔大曽根 www.slideshare.net 機械学習における評価現在は機械学習ライブラリが充実しており、また、Webサービスの普及により学習に必要なデータの獲得も以前と比較して容易になっています。そのため、機械学習のビジネス利用への敷居が下がっています。予測や分類といった問題を解く際には、設定した課題に対してどのモデルが最も適しているかを評価するための指標(評価関数)が必要になります。 Kaggle*1などのコンペティションではあらか