タグ

statisticsに関するhikazohのブックマーク (8)

  • ケーキに3回だけ刃を入れてできるだけ公平に分割したい話 - アジマティクス

    今日は楽しいパーティです。 白雪姫は、円形のケーキを作りました。 白雪姫 円形のケーキに上から1回だけ包丁を入れると、最大2分割できます。 2回包丁を入れると、最大4分割までできます。 では、3回包丁を入れると最大で何分割できるでしょうか。そのまま考えると、6分割でしょうか? 上図のように切れば、最大で7つに分割することができます。 ちなみに回包丁を入れると最大分割、回だと、回だと、そして回だと最大個のピースに分割できることがわかっています。なるべく多く線が重なるように切ればいいのです。実際にやって確かめてみたい感じありますが、しかし今回の題はそこではないのでまたこんどにしましょう。 白雪姫は、王子様からもらった大切な包丁をあまり使いたくなかったので、ケーキに3回だけ包丁を入れて7つに分割し、それを7人のこびとたちに下図のように配ることにしました。 こびとたち しかし、このような切り方で

    ケーキに3回だけ刃を入れてできるだけ公平に分割したい話 - アジマティクス
  • Incanterのグラフのフォントが文字化けする問題(Clojure)

  • ベイズ統計の入門書が出版ラッシュなのでまとめてみた - ほくそ笑む

    【宣伝】2016/09/14 このページに来た方へ。あなたが求めているはこれです。 StanとRでベイズ統計モデリング (Wonderful R) 作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行この商品を含むブログ (10件) を見るまずこれを予約してから下記を読むといいです。 【宣伝終】 最近、ベイズ統計の入門書がたくさん出版されているので、ここで一旦まとめてみようと思います。 1. 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 (2015/6/25) 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2015/06/25メディア: 単行この商品を含むブログ (6件) を見る データ分析業界ではかなり有名な豊田秀樹先生のです

    ベイズ統計の入門書が出版ラッシュなのでまとめてみた - ほくそ笑む
  • R言語で複数ファイルにわかれたデータを1つのdata.frameに一括で読み込む - かずきのBlog@hatena

    別記事にもっといい方法を書きました。 blog.okazuki.jp ということをしたかった。 例えば以下のような namelist1.csv namelist2.csv namelist3.csv という感じのファイルがあるとして、これを1つのdata.frameに突っ込みたい。 R初心者的にがんばったらこうなった。もっと簡単にRらしくかけるのだろうか x <- lapply(list.files(getwd(), "namelist[0-9].csv"), read.csv) accum <- x[[1]] for (i in 2:length(x)) { accum <- rbind(accum, x[[i]]) }

    R言語で複数ファイルにわかれたデータを1つのdata.frameに一括で読み込む - かずきのBlog@hatena
  • Python 機械学習プログラミング データ分析演習編

    この資料では、Pythonデータ分析ライブラリーである「pandas」を使う練習を目的として、データ分析の初歩的な内容を解説しています。 2015/11/25 ver1.0 公開 2015/12/11 ver1.1 仮説検定の説明を分かりやすく修正 2016/11/15 ver2.0 改訂版公開、scikit-learnの利用例を追加 2017/06/11 ver2.1 仮説検定パートを削除、sklearnの利用例をアップデートRead less

    Python 機械学習プログラミング データ分析演習編
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • トレジャーデータで実践:A/B テスト(理論編) - トレジャーデータ(Treasure Data)ブログ

    はじめに トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 記事ではテストの概念および解釈の方法について説明します。はじめに統計学を強力にサポートする確率論の「大数の弱法則」「中心極限定理」を紹介し,次に背理法に基づくテストの概念を紹介します。 Ⅰ. 統計学の基スタンスについて 私達が手元に得られるデータというのは,たいていの場合が全体(母集団)の中の一部(標)である事が多いです。例えば労働調査データでは国民全員のデータでは無く,その中の10万人を独立ランダムにピックアップしたものです。 また,母集団の中からどのようなルール(分布)に従って標が得られるのかもわからないことが多いです。例えば(必ずしも平等でない)コイン投げでは,その母集団は {表, 裏} であることは知っていても表がどれくらいの確率で現れるのかはわかりません。 世の中の多くの事象というのはこ

  • 1