タグ

statisticsに関するkiririmodeのブックマーク (27)

  • 業種の調べ方(日本標準産業分類)

    給付金の申請などをしていると、「業種については、日標準産業分類の大分類において分類された業種区分を記入してください。」といった場面に出くわすことはありませんか? このページでは、日標準産業分類での業種の調べ方を記載しておきます。 日標準産業分類については、総務省の公式サイトに羅列されております。 日標準産業分類は何度か改定されているようですが、「日標準産業分類(平成25年10月改定)(平成26年4月1日施行)」というのが令和3年4月時点での最新版のようです。 しかし、これは、羅列されているだけで、自分がどれに該当するのか探すのは大変です。 総務省に電話すると教えてもらえるのかと思う方もいるかもしれませんが、 総務省のサイト「日標準産業分類(平成25年10月改定)(平成26年4月1日施行)」に、 「※1 日標準産業分類は、統計の結果を表示するための分類であり、個々の産業を認定す

  • 日本標準産業分類(令和5年[2023年]7月改定) | 統計分類・用語の検索 | 政府統計の総合窓口

    ■検索条件には以下の演算子が指定できます。 ・「空白」または「and」…すべてのキーワードを含むページが検索されます。 ・「-」…キーワードを含むページが検索対象から除外されます。 ・半角括弧「()」…括弧内のキーワードを優先します。 (なお「and」を指定するときは前後に空白が必要です。 「-」を指定するときは前に空白が必要です。) ■キーワードと演算子の組み合わせで入力します。 ・例 「米 and 水」など

    日本標準産業分類(令和5年[2023年]7月改定) | 統計分類・用語の検索 | 政府統計の総合窓口
    kiririmode
    kiririmode 2024/01/27
    日本標準産業分類の確認および各分類の意味の確認
  • 中心極限定理の証明をわかりやすく基礎から解説!

    kiririmode
    kiririmode 2023/12/03
    こちらも特性関数を用いての中心極限定理の証明
  • bpr.dvi

    kiririmode
    kiririmode 2023/12/03
    特性関数を用いた中心極限定理の証明
  • 12prob1-11.dvi

    kiririmode
    kiririmode 2023/12/03
    特性関数が確率分布と1:1対応することを表現するLeviの反転公式の証明
  • ガンマ関数とベータ関数の関係式とその証明

    証明 ガンマ関数の定義より, \begin{aligned}\Gamma(x) \Gamma(y) &= \int_0^\infty s^{x-1}e^{-s}\,ds \int_0^\infty t^{y-1}e^{-t}\, dt \\ &=\int_0^\infty\int_0^\infty s^{x-1}t^{y-1}e^{-s-t}\,dsdt. \end{aligned} ここで, s=uv,\, t=u(1-v) と置換積分する。 \{(s,t)\mid s,t\in (0,\infty)\} = \{(uv, u(1-v))\mid u\in(0,\infty), v\in (0,1)\}, \begin{aligned} dsdt &= \left| \det\begin{pmatrix}\partial s/\partial u & \partial s/\partia

    ガンマ関数とベータ関数の関係式とその証明
    kiririmode
    kiririmode 2023/10/22
    ガンマ関数とベータ関数の関係式に関するスタンダードな証明
  • ガンマ関数とベータ関数のよくある関係 - 倭算数理研究所

    特殊関数の公式を証明していくシリーズ(目次)。 今回は、ガンマ関数とベータ関数を関係づける以下の式を証明します: ただし、 は積分変数を に変換すればすぐに示せるので、証明は省略。 【この記事の内容】 ガンマ関数とベータ関数の定義 証明 ガンマ関数の別表現 ベータ関数の別表現 ガンマ関数とベータ関数の関係式 【補足】 まとめ 【追記】 ガンマ関数とベータ関数の定義まずはガンマ関数とベータ関数の定義は以下で与えられます: 証明証明には上記のガンマ関数、ベータ関数の定義ではなく別の表現を使うので、まずはそれらを求めます。 それらが求めた後、それらを使って上記の関係式を示します: ガンマ関数の別表現 ベータ関数の別表現 ガンマ関数とベータ関数の関係式 ガンマ関数の別表現ガンマ関数の定義に現れる積分変数 を以下のように に変換しましょう: このとき 積分測度 積分区間 なので となります。 ベータ

    kiririmode
    kiririmode 2023/10/22
    ガンマ関数とベータ関数の関係式を極座標を使って証明するパターン
  • 【徹底解説】多変量正規分布とは | Academaid

    \begin{align} f_{\mX}(\vx) &= \frac{1}{(2\pi)^{D/2}|\Sigma|^{1/2}}\exp \left\{ -\frac{1}{2}(\vx-\vmu)^T \Sigma^{-1}(\vx-\vmu) \right\} \\[0.7em] M_{\mX}(\vt) &= \exp\left( \vmu^T\vt + \frac{1}{2}\vt^T\Sigma\vt \right) \\[0.7em] E[\mX] &= \vmu \\[0.7em] V[\mX] &= \Sigma \end{align}

    【徹底解説】多変量正規分布とは | Academaid
    kiririmode
    kiririmode 2023/10/03
    多変量正規分布の確率密度関数導出。モーメント母関数から期待値と分散も。
  • 【新卒研修資料】基礎統計学 / Basic of statistics

    株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。

    【新卒研修資料】基礎統計学 / Basic of statistics
  • 1100万行・32GB超の巨大CSVファイルの基本統計量を4GBメモリマシンで算出する - Qiita

    はじめに この記事は,Kaggle Advent Calendar 2022第6日目の記事になります。 記事では、 32GB超のCSVデータの基統計量を、小規模マシンでも省メモリかつ高速に計算するテクニック について解説します。 Kaggleコンペに限らず、 マシンスペックが低いため、大きなデータセットを満足に処理できず困っている 毎回行うファイル読み込みが遅いので、もっと高速化したい ⚡ といった悩みや課題を抱えている方の参考になれば幸いです。 モチベーション データ分析業務やKaggle等のコンペティションで初めてのデータセットを扱う場合、いきなり機械学習アルゴリズムを行うことはまず無く、最初にデータ観察を行うのが一般的です。 テーブルデータであれば、各カラムの基統計量(最小値、最大値、平均、分散、四分位数)などを計算・可視化し、データクレンジングの要否や特徴量設計の方針などを検

    1100万行・32GB超の巨大CSVファイルの基本統計量を4GBメモリマシンで算出する - Qiita
    kiririmode
    kiririmode 2023/06/09
    メモリに載らない量のデータの基本統計量の算出
  • 統計1級(医薬生物学)に合格した話 - i5882353iの日記

    統計1級に合格したぜ!惰眠です。 2022年11月20日の統計検定1級の試験(数理・応用(医薬生物学))に合格しました。 数理の方では、成績優秀との評価も頂けました。 統計1級、数理応用とも一発合格していた!! 数理の方では優秀にも入っていた、よかったよかった マジで安心しています pic.twitter.com/bJR4q5LCxV — 惰眠 (@5882353i) 2022年12月19日 これは数学の授業のない理系の大学3年生が統計1級とかいう積分RTA祭に挑み、一発合格を果たすまでの感動秘話です。 統計1級という試験について 数理・応用に共通の性質 統計数理の性質 統計応用の性質 ぼくの受験体験 対策 統計準1級に合格している人向け いきなり統計1級に挑戦する人向け 確率分布曼荼羅つくり 過去問演習 以外の便利な記事・動画 知識を得るもの 茨城大学の新納先生の資料 はじめての統計学

    統計1級(医薬生物学)に合格した話 - i5882353iの日記
  • 統計検定準1級に合格した話 - i5882353iの日記

    2022年4月13日の試験で統計検定準1級に合格したので、記事を書く気になりました。daminです。(Twitter: @5882353i) うおおおおおおお統計検定準1級合格!!!!!!!うおおおおおおお!!!おおおおおお!!!!!!うおおおおおお!!!!!!!!!!!!!!! pic.twitter.com/J1LDsgUVm1 — 惰眠👻 (@5882353i) 2022年4月13日 背景や、合格するまでに使ったなどを書いていきます。 背景(受験までのおおまかな流れなど) 余談:センター統計選択のススメ 持っていた方がよいもの・知識 線形代数の知識 Pythonの知識 goodnotes5 使った 東大出版の統計学入門(通称:赤い) 公式の準1級対策(通称:ワークブック) 過去問 クラインバウム生存時間解析 ゼロDL ベイズ漫画 まとめ 真剣に読んでいる人向けのまとめ あま

    統計検定準1級に合格した話 - i5882353iの日記
    kiririmode
    kiririmode 2023/01/04
    学びたい
  • コホート分析とは?ユーザーの動向を深く理解し、施策に活かす | CX Clip by KARTE

    Webサービスやアプリを事業として成長させるためには、アクセス数/起動数やコンバージョン数、コンバージョン率、リテンションレートなど継続的に計測すべき指標が多数あります。 それらの指標を分析する際、「初回アクセス/起動日が同じ」や「経由したキャンペーンが同じ」など、ユーザーを細かく分けて数値をみると、より正確にユーザーの動向を把握できます。 そのために用いられる分析方法がコホート分析です。今回はコホート分析とは何か、注目されている理由、Google Analyticsを用いた基的な分析方法を解説していきます。 コホート分析とは? 「コホート」とは「同じ時期に近しい経験をしている人々のグループ」を指す言葉です。「コホート分析」は、もともと心理学や社会学において用いられており、世代や社会的な経験によって被験者を分け、行動や意識にどのような変化が表れるのかを調べる分析手法です。 Webマーケテ

    kiririmode
    kiririmode 2022/01/07
    コホート分析とは何か、およびGAでのコホート分析
  • 仮説検証とサンプルサイズの基礎 - クックパッド開発者ブログ

    パートナーアライアンス部 森田です。有料会員の獲得施策や、それに関わるサービス内動線の最適化を担当しています。 記事の対象 仮説検証を通じて何かを改善をしたいと思っている人 仮説検証の際に「どれくらいのデータを集めたら良いか」分からない人 はじめに 仮説検証とは「仮説を立て、それを証明するためのデータを集め、真偽を確かめること」です。今回は仮説検証を行う際の手順と、その検証に必要なサンプルサイズの考え方を説明します。サンプルサイズの話のみ関心があるかたは、前半を飛ばし「サンプルサイズの決め方」を読んでください。 目次 記事の対象 はじめに 目次 仮説検証のつくりかた 1. 仮説をたてる 2. 施策/KPIを考える 3. 仮説検証後のアクションを決める 4. 対象を決める 5. サンプルサイズを計算する サンプルサイズの決め方 答えを先に サンプルサイズを決める二つの要素 「二つの平均値」と

    kiririmode
    kiririmode 2021/08/16
    仮説検証時に統計的にどれだけのサンプルを必要とするのかの考え方
  • ダメな統計学を防ぐための書籍11冊|Colorless Green Ideas

    科学における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐために読むと良いについて紹介する。 はじめに この記事では、科学研究における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐ方法を学ぶために役立つと思われる書籍を紹介する。主に、統計的仮説検定で間違いを犯さないようにする場合に役立つ書籍を紹介するが、それ以外の分野の書籍についても紹介する。 なお、『ダメな統計学――悲惨なほど完全なる手引書』は、科学の世界での統計の誤用について説明したで、私が日語訳に当たった。2017年1月27日から販売された。このの詳しい紹介は、「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事に書いたので、そちらもご参照願いたい。 アレックス・ラインハート〔著〕・西原史暁〔訳〕.(201

    ダメな統計学を防ぐための書籍11冊|Colorless Green Ideas
  • 数字で語れる!webで手に入る統計データサイトまとめ20選

    仕事の資料やブログでも「統計データ」を使いたい!ってときがありますよね。 数字を上手に使えると説得力が出ますね。 そう、私たちは「数字に弱い」のです。 私は数学能力が著しく低く、Excelも大して使えないんですが、そんな私でもたまには説得力ある資料を作りたい!と思うときがあるんです。 そんな時に、二次情報を手に入れるために、利用しているウェブサイトをご紹介します。保存版ですぞよ。 【一次情報・二次情報とは?】 一次情報とは、調査のために自分で採ったデータのこと。 二次情報とは、自分以外の誰かが調査して集めたデータのこと。 欲しい統計情報が検索しても出てこない・・・ってときにイライラしないように、記事をブックマークしておくと便利かもしれませんね。これは便利!と思った統計情報があれば、随時更新していきますね。 また、統計情報を使って資料を作成すると、あなたの資料がちょっぴりかっこよくなること

    数字で語れる!webで手に入る統計データサイトまとめ20選
  • オンラインで無料で読める統計書プラス32冊|Colorless Green Ideas

    はじめに 数年前に「オンラインで無料で読める統計書22冊」という記事を書いた。タイトルにあるように、オンラインで無料で読める統計書として、入門者向けから高度なものまで合わせて22冊紹介した。 その後、オンラインで無料で読める統計書をさらに発掘したので、ここに紹介しておきたい。今回新しく紹介するのは、32冊である。「オンラインで無料で読める統計書22冊」と合わせてご覧いただきたい。 統計学の入門 まずは、統計学を始めて学ぶ人に向けて書かれた書籍を紹介しよう。 村上正康・安田正實.(1989). 『統計学演習』東京:培風館. 統計学を始めて学ぶ人のための入門書。 記述統計、確率分布、推定・検定の基礎、簡単な線形回帰といった内容を扱っている。入門書としてはオーソドックスなところを扱っていると言えよう。 中澤港.(2003).『Rによる統計解析の基礎』東京:ピアソン・エデュケーション. 統計学を始

    オンラインで無料で読める統計書プラス32冊|Colorless Green Ideas
  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • 『統計学が最強の学問である』感想 - 社会学者の研究メモ

    読みました! 自信をもって学生にお勧めできるであると思います。 統計学が最強の学問である 作者: 西内啓出版社/メーカー: ダイヤモンド社発売日: 2013/01/24メディア: 単行(ソフトカバー)購入: 11人 クリック: 209回この商品を含むブログ (126件) を見る 「統計学が最強」という言い方の"根拠"となっているのは、なによりもランダム化比較実験によって理論や経験知をすっ飛ばして因果関係に白黒つけることができるから、ということらしいです。このカテゴリーの(いわゆる統計リテラシー)は数あれど、たいていは調査(標抽出)の怪しさや分かりやすい擬似相関について言及があるのみで、ランダム化を基軸に据えた記述はほとんどなかったと思います。言うまでもなく、R. フィッシャーの大発明であるランダム化は、実験のみならず調査観察データの分析の方針(特に計量経済学のもの)にも決定的な影

    『統計学が最強の学問である』感想 - 社会学者の研究メモ