タグ

統計と食べログに関するsds-pageのブックマーク (4)

  • 食べログ3.8問題に終止符を打つ

    import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp

    sds-page
    sds-page 2019/10/16
    トリガーは金払ってるかどうかじゃなくて「有力レビュアー」のレビューだろう。有力レビュアーは有料無料関係なくレビューするが絶対数が足りてないので壁ができる。問題は有力レビュアーが金貰ってレビューしてるか
  • 食べログ3.8問題の雑な追試

    がっつり行うのも面倒だったので 10/10 の夜時点で下記地域ごとの「ランキング」に掲載店のすべてのスコアを集めた。 シンプルに、すべて、だ。 銀座飯田橋大井、蒲田小金井・国分寺・国立調布・府中・狛江東急沿線秋葉原・神田・水道橋日橋渋谷・恵比寿・代官山上野京王・小田急沿線町田・稲城・多摩ヒストグラムはここ↓↓https://imgur.com/f7FZnnu 3.8の壁は見えないぞ? https://clean-copy-of-onenote.hatenablog.com/entry/tabelog38_problem にある 評価数が少ないと、小数のユーザーで評価点がバラついてしまうので、 一定以上の評価数がある店舗に絞って情報を取得します が曖昧であるので厳密にしていただきたい。

    食べログ3.8問題の雑な追試
    sds-page
    sds-page 2019/10/11
    試しに近所のラーメン屋を検索してみたら有名店でも3.55が最高点だったから肌感覚でもその辺に壁があるような気はする
  • データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary

    (2019/10/12追記 データ解析のプログラムもGitHubで公開しました) (2019/10/15追記 会員の見分け方に誤りがありました。文中では"非会員"と"有料会員"に分けると述べていますが、正確には"非会員・無料会員"と"有料会員"に分かれています。以後の図・文章は脳内で変換していただけると幸いです。詳細は https://anond.hatelabo.jp/20191011180237 で他の方が調べてくださっています) はじめに この記事は、藍屋えん氏( @u874072e )の以下のブログに触発されて、個人的に行った一連のデータ解析をまとめたものです。 clean-copy-of-onenote.hatenablog.com 上のブログでは、べログ3.8問題と称される問題、 「評価3.8以上の店舗は年会費を払わなければ評価を3.6に下げられる」 との説をべログの店舗

    データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary
    sds-page
    sds-page 2019/10/11
    有料会員かどうかの判定基準が間違ってるから3.6と3.8にピークがある事の追試にしかなってないと / 判定基準は合ってるとの事。この記事には問題はない
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
    sds-page
    sds-page 2019/10/09
    限界突破しないとそれ以上レベルが上がらないゲームみたい
  • 1