タグ

統計に関するmalmacのブックマーク (8)

  • 受動喫煙防止法について論点整理①:受動喫煙による健康リスク・死亡者数の推定はどのくらい信用できるか? - Unboundedly

    受動喫煙の防止策として、室内全面禁煙を目指す厚労省側とそれに反発する自民たばこ議連が争っています。件に関しTwitter上でも、なかなか面白いディスカッションがおきています。 室内禁煙による受動喫煙対策は「科学的根拠(エビデンス)」に基づくものであり、国際的なスタンダードとなっているため実施すべきであるとする(私自身を含めた)公衆衛生・医療関係者らの主張に対して、経済学者・統計学者の方々から辛辣なご批判が届いています。 指摘されている内容を読んでみると、たしかに言っていることに一理ある。というか指摘はおおむね”正しい”のです。やはり経済学者はデータ分析に厳しい。とても素晴らしいことだと思いますし、私も彼らを尊敬し、そのようになりたいと日々思って勉強しています。しかし今回の件に関する批判はごもっともとして、あたかも「室内禁煙は支持するデータは全くのデタラメで信用ならん。やはり禁煙なんてすべ

    受動喫煙防止法について論点整理①:受動喫煙による健康リスク・死亡者数の推定はどのくらい信用できるか? - Unboundedly
  • シリコンバレーのIT企業が利用しているA/Bテスト手法まとめ - ij_spitz's Blog

    いま注目すべきシリコンバレーの有名なIT企業は新規のデザインや機能が有効かどうかを検証するためにA/Bテストを行っています。 その一方で、日の企業も含め、A/Bテストを番環境で導入している企業は非常に少ないです。 加えて、日で言われているA/Bテストと海外で言われているA/Bテストは少々異なるものだと感じています。 日のA/Bテストはフォームの最適化やデザインの修正にとどまっている一方で、海外のA/Bテストはプロダクト開発のサイクルの一部分となっています。 プロダクト開発のサイクルの一部としてA/Bテストを取り入れるためには、大量のテストを定常的に回していく仕組みが必要となってきます。 そこでデータドリブンであると言われているようなシリコンバレーのIT企業は自社でA/Bテストの基盤を作成しています。 今回は社内A/Bテスト勉強会で発表するために、シリコンバレーの有名IT企業がどのよ

    シリコンバレーのIT企業が利用しているA/Bテスト手法まとめ - ij_spitz's Blog
  • 出現確率1%のガチャを100回引いても,4割近くの人は全部はずれる。“本当の確率”を読み解いてみよう

    出現確率1%のガチャを100回引いても,4割近くの人は全部はずれる。“当の確率”を読み解いてみよう ライター:宮里圭介 まったく確率表示をしていなかったり,レア度別の確率のみ表示したりと,タイトルによって対応はさまざまだ スマートフォン向けゲームに欠かせない存在となっている「ガチャ」。お目当てのキャラやアイテムを引き当てたときの嬉しさは格別だし,結構な額のリアルマネーを使ったあげく,ハズレばかりだったときの悔しさもまたかなりのものだ。 すべては運にかかっているので,プレイヤーが頼りにできるデータといえば,公開されている出現確率ぐらいだろう。以前はその確率が公開されていないゲームが多かったが,最近は業界として確率表示を進める動きが強まっており,人気タイトルの「グランブルーファンタジー」でも,日(2016年3月10日)から装備品個別の出現確率が表記されるようになる。 だが,確率が明らかにな

    出現確率1%のガチャを100回引いても,4割近くの人は全部はずれる。“本当の確率”を読み解いてみよう
  • 統計学の基礎の基礎

    ベイズ統計学の基礎概念からW理論まで概論的に紹介するスライドです.数理・計算科学チュートリアル実践のチュートリアル資料です.引用しているipynbは * http://nhayashi.main.jp/codes/BayesStatAbstIntro.zip * https://github.com/chijan-nh/BayesStatAbstIntro を参照ください. 以下,エラッタ. * 52 of 80:KL(q||p)≠KL(q||p)ではなくKL(q||p)≠KL(p||q). * 67 of 80:2ν=E[V_n]ではなくE[V_n] → 2ν (n→∞). * 70 of 80:AICの第2項は d/2n ではなく d/n. * 76 of 80:βH(w)ではなくβ log P(X^n|w) + log φ(w). - レプリカ交換MCと異なり、逆温度を尤度にのみ乗す

    統計学の基礎の基礎
  • ハンバーガー統計学にようこそ!

    |向後研究室ホームへ|次へ→ ハンバーガーショップで学ぶ 楽しい統計学 ──平均から分散分析まで── Web独習教材「ハンバーガーショップで学ぶ楽しい統計学《にようこそ! この教材は、実際に大学の授業で使用したものです。それを一般公開しますので、どうぞお役立てください。 下のメニューに従って1章から7章まで順番に学習していくと、平均から分散分析までを習得することができます。大学の卒業論文レベルで使う統計学として、きっと役立つことでしょう。なお、相関(相関から因子分析まで)については、姉妹編の「アイスクリーム屋さんで学ぶ楽しい統計学《が公開されています。 さあ、がんばって進めていきましょう。 教材メニュー

  • グラフでウソをつく方法――統計リテラシーのための基礎文献(松谷創一郎) - エキスパート - Yahoo!ニュース

    ウソグラフの世界 ここ数年、統計学がブームとなっています。オープンデータやビッグデータなど、IT化の進展とともにそれまで以上にさまざまな数字が扱われるようになっています。 そんな統計において、欠かせないものがグラフです。数値を図形化して視覚的な理解をうながすグラフには、棒グラフ、折れ線グラフ、円グラフなどなど、さまざまな種類があります。 ただ、意図的かどうかはさておき、作為が加えられたグラフを見かけることも珍しくありません。数値に手を加えることはもってのほかですが、それよりも目立つのは見せ方を工夫(作為)して実際の数値以上の効果や影響を錯覚させようとするものです。そうしたものは、「ウソグラフ」あるいは「クソグラフ」などと呼ばれたりします。 それでは、こうしたウソグラフにはどういうものがあるのでしょうか? 電子コミック市場は急成長? 先日『News Picks』という新興のネットメディアに、

    グラフでウソをつく方法――統計リテラシーのための基礎文献(松谷創一郎) - エキスパート - Yahoo!ニュース
  • コサイン類似度を求める

    研究でコサイン類似度を求めなくてはならなくなりました。コサイン類似度ってなんだ??どうやるんだ??まったく検討つかない!というレベルから、計算式はわかった!とりあえず値を出す関数まで作ろう!というレベルに達したのでメモしておきます。あんまりコサイン類似度自体の質はわかってないかもしれませんが、遅延評価勉強法というかんじです。 コサイン類似度とは 2つのデータが似ているかどうかを、文字列が似てるのを調べる分野では距離などで換算します。ちょっとよくわからないかもしれませんが、ぴいことぴいたろう君の類似度は、なんらかの測定器を使うと60mくらいの距離です。ぴいこと弟の類似度は、その測定器では30mくらいの距離でした。弟とぴいこは近いので、ぴいたろう君より似ています。 みたいなかんじ。 コサイン類似度ではベクトルというものを使います。ベクトルってなんだ!!わけわかんねーこと言うな!!!と思ってい

  • 今から統計学を学ぶならコレ!間違い無しの超良質記事まとめ10選。 | SIROKグロースハックブログ

    グロースハックを格的にしようとすると、統計学が出来ると凄く便利!今回は、この記事を見ておけば今からでも統計学を使いこなせるようになる記事をピックアップしましたので、ご覧下さい! ハンバーガーショップで学ぶ楽しい統計学 にもなっている統計学の入門には最適な決定版サイト。広く使われている統計手法について分かりやすく解説されています。 オンラインで無料で読める統計書22冊 Web上で閲覧可能な統計書がまとめられている超お得な情報が詰まっている記事。 WEBで読める統計関係の良質な資料 統計に関する良質な資料がまとめられている記事。 統計屋による新社会人のための統計系入門書お薦め一覧 統計について学べる入門書についてまとめられている記事。 統計学を勉強するときに知っておきたい7つのポイント 統計学を学ぶ上で、重要なポイントが整理されている記事。 統計学を勉強するときに知っておきたい

    今から統計学を学ぶならコレ!間違い無しの超良質記事まとめ10選。 | SIROKグロースハックブログ
  • 1