タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

pythonとPythonとstatisticsに関するheadless_pastaのブックマーク (6)

  • ポケモンで確率統計 (無相関検定編) - コイキングのCP・体重・身長に相関はあるか - Qiita

    概要 2016年の流行語大賞も獲得したポケモンGO みなさんもたくさんポケモンを捕まえて遊びましたか さてポケモンGOでは、 体重 身長 CP ワザ といった**捕まえたポケモンごとに異なる特徴の値 = 個体値(個体ごとに異なる値)**が存在します。 ぼくは前々から、これらの個体値がどのように分布しているのか、あるいはそれらの間に何か関係があるのかが気になっていました。 まぁただ単純に調べてみたかったというそれだけなのですが(汗) そこでこの記事では、自分が実際に捕まえたコイキングの個体値のデータを使い、CP / 体重 / 身長の各パラメータ間に相関はあるのか(無いと言えるか)という疑問を無相関検定で確かめています 記事ではあくまで**「身近なデータを使って統計分析ができるよ~」ということを楽しくお伝えしたいという趣旨で書いていますので、難しい用語や考え方は極力避けているつもりです。**

    ポケモンで確率統計 (無相関検定編) - コイキングのCP・体重・身長に相関はあるか - Qiita
    headless_pasta
    headless_pasta 2016/12/25
    内容はともかく、100匹のコイキングのデータを手入力したのはおつかれさまでした……
  • 帰無仮説のもとでp値の分布が一様分布になることの証明 - kivantium活動日記

    帰無仮説のもとでp値の分布が一様分布になるらしいのですが、納得できるちゃんとした証明が検索しても出てこなかったので書いておきます。 p値とは何かとか、帰無仮説とは何かみたいな解説は省略します。 証明 を観測値の帰無仮説の分布、をの累積分布関数 をp値の分布、をの累積分布関数とする。 は連続分布で、が逆関数を持つものと仮定する。 (注: 分布の累積分布関数はを満たすような関数) 観測値が帰無仮説に従うとき、が上の一様分布であることを示す。 上の一様分布の累積分布関数は上でという値を取ることと、p値は上の値しか取らないことから、であることを示せばが上の一様分布に従うことが分かる。 観測値がのときのp値をとするとp値の定義より が成り立つ。 (が連続分布と仮定しているので) また、が単調増加することから、 が成り立つ。 以上より、 したがって、であることが分かったのでp値が上の一様分布であること

    帰無仮説のもとでp値の分布が一様分布になることの証明 - kivantium活動日記
  • 【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Update版2023年版データ分析の100冊を書きましたよ! 必読10冊を更新。データサイエンス、データ分析機械学習周りでおすすめ図書10選のような記事は良く見ますが、網羅的な紹介記事はあまり見かけないので自分が欲しいと思い書きました。私よりたくさん読んでいる方は多々いらっしゃると思いますが、記事を書いてくださいな。 別の観点でデータ分析プロジェクトのフェーズ毎の参考書籍紹介という記事を新たに書きました。 データ分析の各フェーズ(データ分析プロジェクト全体-ビジネス状況の理解-データの理解-データの準備-モデルの作成-評価-展開)毎

    【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本 - Qiita
  • アソシエーション分析 - ナンバーズ予想で学ぶ統計学

    アソシエーション分析の説明 アソシエーション分析とは データの中から意味のある関連性を抽出する 手法を指す。 相関係数 はふたつの変数の関係を数値的に示すものだが アソシエーション分析では「Aという条件の時にBが起こる確率」を求めることができる。 相関関係はふたつの変数「A」と「B」があった場合、計算時に「A」「B」を入れ替えても相関係数は変わらないが アソシエーション分析では「A」と「B」を入れ替えると結果は異なる。 つまり変数に方向性があるので、「A ⇒ B」と表記される。この表記を アソシエーション ルール と呼ぶ。 アソシエーション分析の結果は カイ二乗検定 や t検定 における p値 のようにひとつの計算結果では判断できない。 アソシエーション ルールの強さと有効性は以下の3つの値で判断する。 支持度 信頼度 リフト値 支持度 (Support) すべてのデータのなかで「A ⇒

  • 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料

    「第5回 プログラマのための数学勉強会 発表資料 (2015/11/21[sat])」 内容は統計学の素養がある方には基的な事項ですが、ベクトルと内積で見方を変えてみたという点と、あまり統計学に親しみがない方にも理解してもらえるようなまとめになっている、というところにスライドの独自性があると考えていますので、その辺り良ければご覧ください^^

    「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • 1