タグ

statisticsに関するas365n2のブックマーク (21)

  • データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary

    (2019/10/12追記 データ解析のプログラムもGitHubで公開しました) (2019/10/15追記 会員の見分け方に誤りがありました。文中では"非会員"と"有料会員"に分けると述べていますが、正確には"非会員・無料会員"と"有料会員"に分かれています。以後の図・文章は脳内で変換していただけると幸いです。詳細は https://anond.hatelabo.jp/20191011180237 で他の方が調べてくださっています) はじめに この記事は、藍屋えん氏( @u874072e )の以下のブログに触発されて、個人的に行った一連のデータ解析をまとめたものです。 clean-copy-of-onenote.hatenablog.com 上のブログでは、べログ3.8問題と称される問題、 「評価3.8以上の店舗は年会費を払わなければ評価を3.6に下げられる」 との説をべログの店舗

    データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary
    as365n2
    as365n2 2019/10/11
    評価3.6の店舗で会員/非会員の有意の差なし、と。/ 会員に有料・無料の2者があることがここでは未評価とのこと。
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
    as365n2
    as365n2 2019/10/09
    3.6の店から探せという話に見える。
  • ネット炎上の真実と解決策/田中辰雄 / 計量経済学 山口真一 / 計量経済学 - SYNODOS

    インターネット黎明期、多くの人はその可能性に胸を躍らせたものである。とくに、非対面コミュニケーションが飛躍的にしやすくなり、それによる新たなる知の創造が起こることは、大いに期待された。実際、ソーシャルメディアの登場と普及は、「普通の人」による不特定多数への情報発信という、今までにない情報発信/共有のかたちをもたらした。まさに、コミュニケーション革命といえるだろう。 しかし現在、インターネット上での自由な発信や議論について、悲観的な意見が増えてきている。その大きな要因となっていることの1つに、1つの対象に批判や誹謗中傷が集中する、いわゆる「炎上」があげられる。例えば、一般人がUSJでの反社会的行為をブログやTwitterで発信したところ拡散されて批判が集中した事例や、複数の芸能人が行っていたステルスマーケティング(注1)が露呈して批判が集中した事例等、様々な対象・様々な行為に対して炎上が起こ

    ネット炎上の真実と解決策/田中辰雄 / 計量経済学 山口真一 / 計量経済学 - SYNODOS
  • 地震予知「○年以内に△%」の真意 | web R25

    100年後に地震が来る可能性もあるが、計算上無視できるほど低い。そのため実際の 計算では0~48年付近の面積を“ほぼ100%”と扱う 図版製作/山里將樹 地震に関する報道を目にすることが多くなった昨今。「●年以内に地震が起こる確率は●%」という表現もよく見かける。ところでこの確率、そもそも何を100%として算出しているのか? 文部科学省・地震調査研究推進部事務局に話を伺った。 「例えば、“今後10年間に地震が起こる確率が100%”という場合、その10年のどこかで、確実に1回地震が起こることを示しています」 “30年以内にマグニチュード7級の地震が起こる確率が70%”の場合で考えてみよう。これは同部が実際に出した予測で、過去120年で同規模の地震が5回起こった、という事実から導いた数値だ。 「120年間に5回地震が起こったなら、単純に考えて24年に1回の周期で地震が起きている計算に

  • 韓国人認定とリテラシー - 情報の海の漂流者

    大阪から来たと言うだけで在日だと言われた・・・ タイトル通りのエントリーなのだが、トラックバックやはてなブックマークの反応を見ると、ネタだと考える人が多いようだ。 しかし、ネタだと断定するに足る根拠はないし、この件について真面目に考えてみることにしよう。 Q:大阪に朝鮮韓国人は多いのか A: ある意味では多いが、この意味では少ない 韓国朝鮮人問題で良く出てくる特別永住者の数を比較してみよう。 都道府県 特別永住者数 大阪府 109,763 東京都 49,385 兵庫県 48,911 愛知県 34,840 京都府 29,608 神奈川県 21,040 福岡県 15,528 埼玉県 10,052 広島県 9,726 千葉県 9,133 確かに、大阪府は全国平均からみて、韓国朝鮮人の絶対数が多い都道府県だ。 しかし大阪の人口に占める割合を見てみると 大阪府/府内外国人登録者数 によると、大阪

    韓国人認定とリテラシー - 情報の海の漂流者
  • 統計学に興味を持った理由 - 統計学+ε: 米国留学・研究生活

    私が統計学に初めて興味を持ったのは 忘れもしない高校3年生のときだった。 私の高校は男子校で、毎年10月10日すぎに文化祭があった。 内容はお世辞にも面白いものとは言えなかったが、 年にたった一度、たくさんの女の子が来るイベント だったので、毎年盛り上がっていた。 各クラスの出し物は、 男女数人で雑談させてカップリングをする 「フィーリング・カップル」だとか、 暗闇の中で女の子にいたずらをする 「別の意味で怖い」お化け屋敷とか、 どうみても「文化」のかけらも感じられないものだった。 後夜祭では実行委員会が、 「夜道の一人歩きは危険なので一人で帰らないよう」 訪問者に呼びかけ、 溜り場では体育教師がメガホンを持って、 「おまえら、早く決めて帰れ。」 と注意していた。 そんな中、僕は4人の女の子に声をかけて振られ続け、 諦めて友達と帰途についたところ、一人で帰ろうとして いるかわいい女の子を見

    as365n2
    as365n2 2009/10/17
    _[確率]事前分布の概念
  • なぜ丙午の年に乳児死亡率が高いのか - NATROMのブログ

    丙午(ひのえうま)の年に出生率が低下することはよく知られている。ウィキペディアの丙午の項によると、「この年に生まれた女性は気が強い」「一般庶民の間では、この年生まれの女性は気性が激しく、夫を尻に敷き、夫の命を縮める(男をい殺す)とされ」たとのことである。迷信ではあるが、迷信を信じている人が一定数いれば、迷信を信じていない親にも丙午の年の出産を避けるインセンティブが働く。最近では昭和41年つまり1966年が丙午であったが、その前後の年と比較して出生率が減った。 ここまでは別に不思議ではないのだが、丙午の年は、出生率が減っただけでなく、乳児死亡率が高かったのだ。私はこのことを基礎から学ぶ楽しい疫学というで知ったのだが、このには丙午の年に乳児死亡率が高い理由も同時に述べてあったので、考える暇がなかった。答えはこのエントリーの下の方に書いてあるので、クイズとして楽しみたい方は、途中までで読む

    なぜ丙午の年に乳児死亡率が高いのか - NATROMのブログ
    as365n2
    as365n2 2009/10/16
    タイムラグ
  • ポアソン分布

    ポアソン分布     Last modified: Aug 30, 2004 ポアソン分布の確率関数は次式で表される。 \[ f(x) = \frac{e^{-\lambda}\ \lambda^{x}} {x!},\ \lambda \gt 0,\ x = 0, 1, \dots \tag{1} \] ポアソン分布の概形は図 1 のようになるが,$\lambda$ が大きくなると正規分布に近づく(アニメーション,または,ムービー)。 二項分布において,生起確率 $p$ が極めて小さい場合がある。このとき,$n$ が十分に大きくても $n\ p$ は有限なものとなる。そこで,$n\ p = \lambda$ とおき,$n \rightarrow \infty$,$p \rightarrow 0$ としたとき,二項分布の( 1 )式の確率関数 $f ( x )$ を,$\lambda$ と

    as365n2
    as365n2 2009/09/24
    λが大きくなると正規分布に近づく
  • 猫1000匹調査でわかった「毛の色」と「性格」 ニュース−ネット証券・自動車保険のオリコンランキング

    ■調査結果はこちら ベネッセコーポレーションが発行する生活総合誌『ねこのきもち』が実施した飼い1000匹調査で、は“毛の色”によって性格が異なる傾向にあることがわかった。黒と茶が混ざったしま模様の“キジトラ”は、慎重で警戒心が強い性格。全身の大半が白一色の“白”は繊細な性格をしているなど、興味深い結果が出ている。 調査は、同誌読者と同Web利用者を対象に、計1000匹の飼いの「毛の色」と「性格」についてのアンケートを実施、“ノラネコロジスト”として、ノラの社会や生態を研究する山根明弘氏に分析を依頼した。 黒と茶が混ざったしま模様“キジトラ”の慎重で警戒心が強い性格は、「の祖先といわれる野生動物のリビアヤマネコに近い毛色で、その野生的な性質を強く受け継いでいるのではないか」と山根氏は説明。また、映画『魔女の宅急便』に登場するジジでお馴染みの全身黒一色の“黒”は、友好的で

    as365n2
    as365n2 2009/07/03
    _[animal]飼い主に対するアンケート/飼い主の願望が回答になっているケースもあるような気が。
  • significantlyは「著しく」ではない

    Gigazineで、「27歳になると知能が低下する」という記事が注目されているようだ。 日語訳:「一方、27歳になると推理力・思考速度・空間の具現化の3つの項目が著しく低下し始めていることが研究で明らかになったとのこと。」 げ、やべ、俺25歳、後2年だ。大学時代、もっと勉強しておけばよかったしくしく・・・と思って、元の英語の記事を読んでみる: 原文:"The first age at which performance was significantly lower than the peak scores was 27 – for three tests of reasoning, speed of thought and spatial visualisation." あれ?「著しく低下する」なんてどこに書いてあるの?じ~~~・・・・ ・・・・もしかして、"was significa

    significantlyは「著しく」ではない
    as365n2
    as365n2 2009/05/08
    有意の差
  • 3D円グラフを使うのはやめよう | Okumura's Blog

    落伍弟子さんの目の錯覚を誘うグラフの受け売りで申し訳ないが,都立高校教科書採択結果のPDFの図がすべて3D円グラフになっており,目の錯覚で誤解が生じやすい。例えば右図で日文は啓林の2倍あるのに中心角は啓林のほうが大きく,面積比でもほぼ互角に見える。情報リテラシーではっきり「3D円グラフは使うな」と教えてほしい。 Rのヘルプの「pie」の項目にも次のようにあるように,そもそも円グラフが良くない。 Pie charts are a very bad way of displaying information. The eye is good at judging linear measures and bad at judging relative areas. A bar chart or dot chart is a preferable way of displaying this ty

  • 3D円グラフにご注意 | スラド Linux

    三重大の奥村晴彦教授が、「3D円グラフを使うのはやめよう」というブログエントリを書いている。都立高校教科書採択結果のページにあるPDF資料にある図を実例として、3D円グラフでは下側に位置する項目の割合が左右に位置する項目よりも大きく見えてしまう問題があると、このエントリでは指摘している。見た目が良いという理由で3D円グラフが使われているのかもしれないが、このような実際の値が分かりにくくなるような表現は極力ひかえてほしいものだ。 奥村教授はまた、Rのヘルプにある記述を引用して、「そもそも円グラフが良くない」とも指摘している。 追記(by プレゼン作成屋O):嘘をつかない、かつメッセージを分かり易く伝えるグラフの使い方についてはジーン・ゼラズニーのマッキンゼー流図解の技術がお薦めである。たとえば、ひとつだけの構成比を伝える際には(2Dの)円グラフは各要素のシェアに大きな差がある際には妥当だが、

  • 2ちゃんねらーの4割は女性、30~40代が中心。高齢化進む? | スラド IT

    MSN産経ニュースによると、2ちゃんねらーの4割は女性、30~40代が中心だそうだ。一般的なインターネットユーザーのうちの女性の割合は45%ということで、一般よりもちょっと女性が少ないだけ、という意外な結果だった。 また、年齢別に見ると30歳以上のユーザーの割合は合計で73%。最も多いのは40代(29%)、続いて30代(28%)、19歳以下(16%)と続く。 どこまでを2ちゃんねらーと定義しているのかが微妙だが、とりあえず「ROM」だけのユーザーはさまざまな世代の人がいるようだ。

    as365n2
    as365n2 2008/09/05
    “発言小町でも半分近くが男”、“鬼女板が怖いというが本当に怖いのは育児板”
  • 2ちゃんねらーの4割は女性、30−40代が中心 高齢化のせい? - MSN産経ニュース

    4割が女性、30−40代が主力ユーザー−。インターネット利用動向調査のネットレイティングス(東京都渋谷区)が公表した、掲示板や動画共有などCGM(消費者生成メディア)系サイトの利用動向に関する調査結果で、大手掲示板「2ちゃんねる」の“意外”な利用実態が明らかになった。 2008年7月度の同社調査によると、「2ちゃんねる」利用者の性別割合は男性が60%、女性が40%(インターネット全体の割合は男性55%、女性45%)。また、年齢層別の割合は19歳以下が16%、20−29歳が11%、30−39歳が28%、40−49歳が29%、50歳以上が16%と、30−40代が主力ユーザーであることが判明した。 この結果は、当の2ちゃんねる利用者にとっても意外だったようで、「意外に女が多いのに驚いた」「10代〜20代後半くらいまでが多いのかと素で思ってた」との反応が相次いだ。 30−40代の利用が多い理由につ

  • 2chやYouTubeより長い「発言小町」利用時間

    ネットレイティングスの調査によると、読売新聞社の女性向けQ&Aサイト「発言小町」の7月の月間利用時間(家庭PCからのアクセス)が1時間21分50秒に上った。「YouTube」(1時間17分38秒)や「2ちゃんねる」(56分19秒)より長く、「Yahoo!JAPAN」のトップページ(38分32秒)の約2倍となっている(「こんな“お化けサイト”になるとは思っていなかった」――「発言小町」なぜ人気)。 サイト名 月間ユニークユーザー数 月間利用時間 サイトの種類 発言小町

    2chやYouTubeより長い「発言小町」利用時間
    as365n2
    as365n2 2008/09/05
    _[marketing]
  • Google Earthで調べた結果、牛や鹿は食事/休憩時に南北を向く傾向が判明 | スラド サイエンス

    グーグルアースで世界の牧草地308か所、牛8510頭を調べた結果、大半が北か南を向いており、その方位を平均すると、正確な南北よりも多少ずれている地磁気の南北に近かったそうだ(読売新聞の記事、nature newsの記事、論文要旨)。 また、チェコで2種類のシカについて現地調査したところ、事・休憩・睡眠(雪の上の痕跡)、いずれも大半が北か南を向いていたという。一応、牛・鹿での研究ではあるが、やはり北枕(南枕)には進化論上の理由があるんだなと思った次第。

    as365n2
    as365n2 2008/08/28
    “サンプルを無バイアスで選ぶというのは困難”
  • はてなブログ | 無料ブログを作成しよう

    新米と秋刀魚のわた焼き お刺身用の秋刀魚を買いました。1尾250円です 3枚におろして、秋刀魚のわたに酒、味醂、醤油で調味して1時間ほど漬け込み、グリルで焼きました 秋刀魚のわた焼き わたの、苦味が程よくマイルドに調味され、クセになる味わいです 艶やかな新米と一緒に 自家製お漬物 土…

    はてなブログ | 無料ブログを作成しよう
  • Googleユーザーを腹立たせた、あの調査結果の裏にヤフーの影? ぱるぷんてにゅーす

    Googleユーザーを腹立たせた、あの調査結果の裏にヤフーの影? つい先日、こんな調査結果がネット上で話題を集めました。 GoogleユーザーはYahooユーザーよりも友達がいない GoogleユーザーはYahooユーザーより老けており、未婚率が高い この偏見に満ちた調査を行った株式会社Eストアーについていろいろと調べてみました。 そこでわかったいろいろな事実。包み隠さずお話します。 【PR】 その調査結果がこれ。(↓クリックで拡大) (株式会社Eストアー調べ) これを見て自分が疑問に思ったことを箇条書きにしてまとめてみました。 疑問:調査の仕方 ・調査期間が2007年10月4日~5日ときわめて短い。 ・全国の12歳以上の男女412名とあるが、統計学的に、この調査人数はかなり少ない。 ・YahooユーザーとGoogleユーザーの調査人数の数があまりにも違う。いくら日ではyahooユー ザ

  • シンプソンのパラドックス - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "シンプソンのパラドックス" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2012年10月) 母集団全体では負の相関があるにもかかわらず、各層では正の相関があるといった逆転現象が起こり得る。 シンプソンのパラドックス(英: Simpson's paradox)もしくはユール=シンプソン効果(英: Yule–Simpson effect)は1951年にイギリスの統計学者エドワード・H・シンプソン(英語版)によって記述された統計学的なパラドックスである[1]。母集団での相関と、母集団を分割した集団での相関は、異なっている場合があるという逆

    シンプソンのパラドックス - Wikipedia
    as365n2
    as365n2 2007/12/19
    統計学。「集団を2つに分けた場合にある仮説が成立しても、集団全体では正反対の仮説が成立することがある」
  • 太っているほうが死亡率が低い? | スラド

    やや旧聞に属しますが、BoingBoingで「太っているほうが死亡率が低い」という話が紹介されていました。ニューヨーク・タイムズの元記事によると、これは米国立がん研究所や米国疾病予防管理センターの研究者が中心となって行った研究で、研究結果は専門誌Journal of the American Medical Associationに発表されたそうです。 この研究によれば、肥満の人は、アルツハイマー病やパーキンソン病、感染症や肺の病気といった病気で死ぬ可能性が「ノーマルな」体重の人よりもはるかに低く、肥満の人が罹りがちなガンや糖尿病、心臓病といった病気による死亡率の上昇を考慮に入れても、この結論は変わらないとのこと。よって、死亡率ということだけを考えるならば、「理想体重」という概念を再検討しなければいけないだろうと述べています。もちろん、健康を維持するというのとは話が別ですが…。

    as365n2
    as365n2 2007/11/12
    統計の問題?