タグ

統計に関するskozawaのブックマーク (25)

  • A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog

    リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。 Recruit Data Blogはこちら 汎用人型雑用AIの stakaya です。 たまたま数年前に社内のBLOGに書いたABテストのロジックのまとめ&比較記事を発掘したので、 このまま眠らせているのはもったいないぞと、 圧倒的もったいない精神を発揮し、シェアさせていただきます。 あの頃は私も若かった。 社内では”堅物・真面目・一途”で有名なものでして、下記文章がお硬いのはご勘弁ください。 はじめに 記事は、施策の評価手法としてしばしば用いられるA/Bテスト(A/B testing)について、できる限り背後にある仮定を明記した上で、まとめたものである。 A/Bテストとは、主にインターネットマーケティングにおける施策の良否を判断するために、2つの施策(通常、A・Bと記載)を比較す

    A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog
  • 「統計数理」第64巻 目次

    [ 第1号 | 第2号 ] 第64巻 第1号 統合PDFをダウンロード 特集「生態学における統計モデリング」 「特集 生態学における統計モデリング」について ..........久保 拓弥 (64, 1-2) 全文pdf 動的サイト占有モデル ―状態の不確実性を考慮したサイト占有動態の統計的推測 ..........深谷 肇一 (64, 3-22) 要旨 全文pdf 多変量状態空間モデルを用いたリター分解実験のためのパラメータ推定 ..........仁科 一哉 (64, 23-38) 要旨 全文pdf 水産資源学における統計モデリング ..........岡村 寛、市野川 桃子 (64, 39-57) 要旨 全文pdf 一般化状態空間モデルで漁業動態を記述する ―マサバ努力量管理効果の定量評価 ..........市野川 桃子、岡村 寛 (64, 59-75) 要旨 全文pdf 安定同位

  • 仮説検証とサンプルサイズの基礎 - クックパッド開発者ブログ

    パートナーアライアンス部 森田です。有料会員の獲得施策や、それに関わるサービス内動線の最適化を担当しています。 記事の対象 仮説検証を通じて何かを改善をしたいと思っている人 仮説検証の際に「どれくらいのデータを集めたら良いか」分からない人 はじめに 仮説検証とは「仮説を立て、それを証明するためのデータを集め、真偽を確かめること」です。今回は仮説検証を行う際の手順と、その検証に必要なサンプルサイズの考え方を説明します。サンプルサイズの話のみ関心があるかたは、前半を飛ばし「サンプルサイズの決め方」を読んでください。 目次 記事の対象 はじめに 目次 仮説検証のつくりかた 1. 仮説をたてる 2. 施策/KPIを考える 3. 仮説検証後のアクションを決める 4. 対象を決める 5. サンプルサイズを計算する サンプルサイズの決め方 答えを先に サンプルサイズを決める二つの要素 「二つの平均値」と

  • 効率的な統計実践のための、10個のシンプルなルール | POSTD

    イントロダクション 数ヵ月前、広く成功を収めており、非常に役立つ“10個のシンプルなルール”シリーズの提唱者であるPhil Bourneは、何人かの統計学者に統計に関する10個のシンプルなルールの記事をまとめることを提案しました。(そのルールのうち「PLOSでTen Simple Rulesの記事を書くためのルール」はPhil Bourne ^(1) のものです。その代わり、Philに対するあふれるほどの賞賛で満足してくれると思います。) 10個のシンプルなルールを書くガイドライン ^(1) の中で示唆されているのは、「自分の読者を知りなさい」ということです。私たちはルールのリストを、研究者を念頭に置いて作り上げました。研究者は統計に関する幾分かの知識を持ち、同じビルに少なくとも1人は統計学者がいたり、あるいは健全なDIY精神と、ノートパソコンの中に統計のパッケージを持っていたりするかもし

    効率的な統計実践のための、10個のシンプルなルール | POSTD
  • Private Presentation

    Private content!This content has been marked as private by the uploader.

    Private Presentation
  • 食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog

    フランスの希代の美家であるブリア・サヴァランは「ふだん何をべているのか言ってごらんなさい、そしてあなたがどんな人だか言ってみせましょう」といったそうだ。これは、「ドン・キホーテ」の有名な一文「君の友人を教えなさい、そうすれば君がどういう人間か言ってみせよう」をもじったものであるが、示唆に富んだ文である。その人が何をべるか(もっと正確に言えば、何をべないか)によって、その人の育ちや信仰、文化的・民族的背景など様々なことを知ることが出来る。 同様に、口コミもそれを書いた人について多くを物語る。ここで試しに、以下に挙げたべログの口コミを読んで頂きたい。 バラのクリームにたっぷりのフランボワーズをマカロンとともに。ルバーブのアクセント。コレめっちゃカワイイ(*^_^*) 一目ぼれです☆ バラにフランボワーズにマカロンにピンクときたら、女子にはたまらない~! ちょっと高めの価格設定やけど、

    食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog
  • ベイズ推定の概要 超入門

    自殺の時空間疫学 http://ikiru.ncnp.go.jp/ikiru-hp/genjo/toukei/index.html 少研究数のメタ分析 Noma, H. Statist. Med. 2011, 30 3304–3312 K=10以下での信頼区間を向上させる Topics はじめに 推測統計の基 最尤推定とベイズ推定 MCMCによるベイズ推定

    ベイズ推定の概要 超入門
  • 順序データでもベイズモデリング

    2014.12.6. Nagoya.R #12 外国語教育研究の仮想データを用いてRのlme4パッケージやlmerTestパッケージを使ってみるというような主旨の発表です。 slideshare上から無料でダウンロードできなくなってしまったので,speakerdeckにも同じ資料をあげました。ダウンロードされたい方,広告がうっとおしいという方は下記のURLからどうぞ。 https://speakerdeck.com/tam07pb915/an-introduction-to-lme

    順序データでもベイズモデリング
  • 統計学・データサイエンスの勉強法

    ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。 教師用の教科書と初心者用の教科書 私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、そのだけを読めば分かるようになっていると同じ印象を持ちました。 オンライン教育(MOOC) アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富

    統計学・データサイエンスの勉強法
  • Think Bayes

    サンプルコードを動かして統計の直観的な理解を促した『Think Stats ―プログラマのための統計入門』の著者によるベイズ統計・ベイズ推論の解説書です。ベイズ統計は、不確実な問題を扱い、条件を付けた予測が必要なときに威力を発揮する統計手法の1つ。メールのフィルタやカーナビで使われていることは有名です。書は『Think Stats』と同様、数学的な観点での記述は最小限にとどめ、実例を多く使って実用的観点からベイズ手法を解説します。Pythonで書かれたサンプルコードを使って実際に手を動かしながらベイズ統計を学ぶことができますが、プログラミングを知らない人にも役立つ内容です。 目次 まえがき 1章 ベイズの定理 1.1 条件付き確率 1.2 結合確率 1.3 クッキー問題 1.4 ベイズの定理 1.5 通時的解釈 1.6 M&M'S問題 1.7 モンティ・ホール問題 1.8 議論 2章 計

    Think Bayes
  • 統計的学習の基礎 - 共立出版

    機械学習とは、コンピュータに学習能力を持たせるための方法論を研究する学問の名称であり、もともとは人工知能分野の一部として研究されていた。その後、機械学習は統計学と密接な関わりを持つようになり、「統計的学習」として独自の発展の道を歩み始めた。そして、1990年代から現在に至るまでの計算機やインターネットの爆発的な普及と相まって統計的学習の技術は目覚ましい発展を遂げ、いまや情報検索、オンラインショッピングなど、われわれの日常生活とは切り離すことのできない情報通信技術の根幹を支える重要な要素技術の一つとなった。 書は、このような発展著しい統計的学習分野の世界的に著名な教科書である“The Elements of Statistical Learning” の全訳である。回帰や分類などの教師あり学習の入門的な話題から、ニューラルネットワーク、サポートベクトルマシンなどのより洗練された学習器、ブー

    統計的学習の基礎 - 共立出版
  • 中古マンション売買データを分析してみた(1) - 築年数と駅からの距離は価格にどう影響するか - About connecting the dots.

    新しい年度になって消費税も上がったことで,3月までの駆け込み消費*1の反動でマンションとか全く売れていないんだろうなぁと思う今日この頃です*2.個人的な趣味でいうと新築よりは中古派ですので,増税前に無理矢理ローン組んだ人がさくっと数年で手放したのを買うのとかが,味があってよいと思うわけですけれども.2015年に消費税が10%にあがる公算も高そうですしね. さて,先日こんな興味深い記事を拝見いたしました. 徒歩5分vsバス利用、中古マンションの値下がり具合を可視化 - マンションチラシの定点観測 | マンション選びのお役立ち情報ブログ REINSといえば,不動産会社御用達の物件データベースなわけですが,当然のことながら業者専用のデータベースなので,私のような一般の人はみることができません.と思っていたら,上記記事で紹介があるように,中古物件の成約済みデータに関しては閲覧可能なんですね. 上記

    中古マンション売買データを分析してみた(1) - 築年数と駅からの距離は価格にどう影響するか - About connecting the dots.
  • 確率概念について説明する(第3-1回):可能な世界の全体を1とする — コルモゴロフによる確率の定理(前編) - Take a Risk:林岳彦の研究メモ

    こんにちは。林岳彦です。先日、小学生の息子とセブンイレブンに行きました。そこでふと、「あの外壁、あれ物のレンガじゃなくてただの印刷だから」と息子に教えたところ、それが彼にとっては思いもよらぬことだったようで、実はすべすべとしている外壁に触っては「すっかり騙されてた!(ガーン)」と衝撃を受けていました。小さな子どもをお持ちのみなさま、この世の隠蔽された真実(=セブンイレブンの外壁は印刷)を彼ら/彼女らに教えてみると面白い反応が期待できるかもですよ! さて。 今回は、前回の記事の続きとして、確率という概念の「規格」について説明していきたいと思います。 (今回はとても長い上に内容がハードかもしれません。いつもながらすみません。。) 前回の軽いまとめ 前回の記事では: 少なくとも、「確率」とは「可能性を数値で表したもの」である というボンヤリとした出発点から: 「可能である」ということは、「この

    確率概念について説明する(第3-1回):可能な世界の全体を1とする — コルモゴロフによる確率の定理(前編) - Take a Risk:林岳彦の研究メモ
  • 機械学習や統計に関する情報収集 - Qiita

    機械学習界隈の情報収集方法 http://d.hatena.ne.jp/kisa12012/20131215/1387082769 いきなりですが上記の記事に機械学習に関する有力な情報源がまとまっています。まずはここを参考にするのが良いかと思います。ただ情報が多すぎですので、筆者は Wikicfp と arXiv.org あたりの論文、それにはてなブックマークをチェックしています。 また論文については機械学習の論文を探すにも良い情報がまとまっています。こちらも参考になります。 機械学習は日進月歩の世界ですので、最新の査読済み論文を追って概略だけでも理解する能力を身に付けると良いかと思います。 書籍としては次の 2 冊が聖書とも言える必読書で、気で機械学習をやりたければ必ず参考になるかと思います。 パターン認識と機械学習 (上・下) http://www.amazon.co.jp/dp/4

    機械学習や統計に関する情報収集 - Qiita
  • A/Bテストのガイドライン:仮説検定はいらない(Request for Comments|ご意見求む) - 廿TT

    記事の編集方針 ※この記事に興味をもたれた方は、 A/Bテスト カテゴリーの記事一覧 - 廿TT も、必要に応じてご覧いただければと思います。 記事はもともとは、「A/Bテストの数理」への批判:「有意」とはなにか の続き的なエントリでした。 しかし、予想外に反響があったため Request for Comments(ご意見求む)の精神で、随時更新している部分もあります。 ただし、ベースとなる主張、Web系施策のA/Bテストに、仮説検定は向かないという部分は変化していません。 もしぼくの考えが変わり、「やっぱ仮説検定、いいかも」となった場合、記事の存在価値はほぼ消滅します。 そのようなことがあれば、ページ最上部に「考えが変わりました」と明記します。 また、他の修正箇所も区別して明記し、差分がわかるようにします。 ただし細かい言い回しや、誤字脱字等はだまって修正します。 目次: そもそも

    A/Bテストのガイドライン:仮説検定はいらない(Request for Comments|ご意見求む) - 廿TT
  • https://black.ap.teacup.com/akiyah/1816.html

    https://black.ap.teacup.com/akiyah/1816.html
  • 面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!

    転職して丁度2年がたちました。 現在はWebベンチャーで統計屋しています。大変楽しい毎日です。 なぜ楽しいかというと勿論リスプを書いているからというのも大きなる理由の一つです*1。 このエントリでは何が楽しいのか近況交えてつらつらまとまりなく書いてます。 あと現職の解決しがたい不満についても書いています。 糞長くなってしまったので要約すると 「今糞面白いけど超えられない壁あるので誰か助けて」 です。 現職面白い理由5個。 1.データが面白い*2 私は経済学科・数理統計の研究室出身で、応用先としてコミュニケーション活性化を目的とした 行動経済学やテキストマイニングをやっていました。 そういう背景があるため、学生時代いつか壮大な社会実験をやりたいと思ってたけど、 それには大変なお金がかかったり大がかりなシステムを構築しないといけなかったりで断念した。 ですが今はSNSやソーシャルゲームや広告の

    面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!
    skozawa
    skozawa 2013/12/03
    談話解析難しそうだけど、おもしろそう
  • 5分でわかるベイズ確率

    ベイズ統計学の基礎概念からW理論まで概論的に紹介するスライドです.数理・計算科学チュートリアル実践のチュートリアル資料です.引用しているipynbは * http://nhayashi.main.jp/codes/BayesStatAbstIntro.zip * https://github.com/chijan-nh/BayesStatAbstIntro を参照ください. 以下,エラッタ. * 52 of 80:KL(q||p)≠KL(q||p)ではなくKL(q||p)≠KL(p||q). * 67 of 80:2ν=E[V_n]ではなくE[V_n] → 2ν (n→∞). * 70 of 80:AICの第2項は d/2n ではなく d/n. * 76 of 80:βH(w)ではなくβ log P(X^n|w) + log φ(w). - レプリカ交換MCと異なり、逆温度を尤度にのみ乗す

    5分でわかるベイズ確率
  • Cache::Memcached(::Fast) のネームスペースは最後に区切り文字をいれた方が良い話とネームスペース毎に統計を取る方法 - blog.nomadscafe.jp

    Cache::Memcached(::Fast) のオプションには namespace というのがあります。 https://metacpan.org/module/Cache::Memcached::Fast https://metacpan.org/module/Cache::Memcached Cache::Memcached、Cache::Memcached::Fast、どちらもnamespaceはインスタンス作成時に指定して、あとから変更することは出来ません。 my $s = Cache::Memcached::Fast->new({ servers => [qw/127.0.0.1:11211/], namespace => 'myservice' }); namespaceを使うと、ひとつのmemcachedサーバを複数のアプリケーションから使用する場合などに、それぞれ別のネ

  • 統計屋はどこまで給料をもらうべきか - Willyの脳内日記

    アカデミアでもビジネスでも統計解析のニーズは高くて、 データを分析して欲しいというような依頼は結構くる。 しかし、分析の対価としてどこまで給料をもらうべきなのか、 というのはなかなか難しい問題だ。 完全にビジネスとして外注して、博士レベルの統計屋に 分析をさせると、単価は1時間で100ドル前後のようだ。 以前に、コンサルティング会社が時給75ドルでそういった求人を 出していたから、マージンなどを考えれば大体そんなものなのだろう。 継続的に分析案件が発生するのであれば、 常勤で統計屋を雇えばもっと安く済む。 私も、大学院生の時は、医学部でデータの分析をして、 生活費や給料、健康保険料を払ってもらっていた。 一番厄介なのは、依頼者が案件をあくまで「共同研究」だと考えている場合である。 もちろん雑誌や学会等に投稿することになれば、 分析者として共著者に名前を入れてもらうことになるが、 それが統計