タグ

ブックマーク / sucrose.hatenablog.com (3)

  • ABテストの12の落とし穴 - 唯物是真 @Scaled_Wurm

    Twitterで見かけた以下の記事で紹介されていた論文がおもしろそうだったので読んだ感想と内容のてきとーな紹介(詳しく知りたい人は元論文を呼んでください) マイクロソフトの研究者による、いわゆる A/B テストにおいてメトリックを解釈するときに陥りがちな罠12選。実例がことごとく直感に反していてとても面白かった。 https://t.co/jC9JOsx1uB— Shuhei Takahashi (@nya3jp) 2017年10月11日 内容が間違っている部分があったらコメントなどで教えていただけると嬉しいです 論文 このKDD2017の論文ではABテストの結果を解釈する時に陥りがちな12種類の罠についてMicrosoftの研究者が実例と対策を交えて説明しています Pavel Dmitriev, Somit Gupta, Dong Woo Kim and Garnet Vaz, "A D

    ABテストの12の落とし穴 - 唯物是真 @Scaled_Wurm
  • Twitterで特定のユーザー達が共通してフォローしているユーザーをリストアップする - 唯物是真 @Scaled_Wurm

    前にこんなツイートをした ホクソエムからフォローをされている数で定義されるホクソエム数— 無限猿(id:sucrose)@29月病 (@Scaled_Wurm) 2016年4月1日 連休で時間があったのでTwitter APIに慣れるついでに計算してみた ホクソエムとは よくわからないけど、Twitterで統計や機械学習をやってる人の一部が名乗っている notchained.hatenablog.com メンバーのリストは以下を参考にした @teramonagi/匿名知的集団ホクソエム on Twitter 題 というわけでホクソエムの人達からフォローされている数が多いユーザーを調べるためにTwitter APIを叩いてユーザーのフォロー情報を取ってくる 今回はPythonのライブラリのTweepyを使った 使い方は公式のドキュメントを読めばだいたいわかると思う(ドキュメントが古くて(?

    Twitterで特定のユーザー達が共通してフォローしているユーザーをリストアップする - 唯物是真 @Scaled_Wurm
    hoxo_m
    hoxo_m 2016/05/04
    入っていたので私もデータサイエンス系のアカウントかもしれない。
  • 集合とかベクトルの類似度の計算のメモ - 唯物是真 @Scaled_Wurm

    Pythonで実装する類似度計算 - Screaming Loud #1283. 共起性の計算法 ↑この辺りの記事を見て、集合とかベクトルの類似度の計算の記事を下書きのまま放置していたことを思い出したので書き上げた。 類似度の計算のコードを書いたのでそれを載せるだけにしようかと思ったのですが、知っている人にしか伝わりそうにないので自然言語処理でよく使う話の概要だけでも書いときます。 導入 自然言語処理の分野では単語の意味を比較するときに、ある単語の周り(文脈)に出てきた単語のベクトル(文脈ベクトル)の類似度を計算することがある。 これは「ある単語の意味はその周囲に出現する単語によって特徴づけられている」という仮説に基づいていて、文脈ベクトルが似ていれば似たような意味、似たような状況で使われる単語が多いということが言えるからである。 Distributional semantics - Wi

    hoxo_m
    hoxo_m 2016/01/17
    ありがたや〜
  • 1