statisticsに関するtsutatsutatsutaのブックマーク (48)

  • ジェンダーギャップ指数とかいう使えない指標と女子教育の話|畠山勝太/サルタック|note

    この記事は以下の構成になっています。 1. はじめに 2. ジェンダーギャップ指数で教育項目はどのように評価されているか? 3. ジェンダーギャップ指数の教育項目の問題点 4. 日教育にジェンダー問題は存在しないのか? 5. 女子教育問題の見落としが致命傷になる理由 1. はじめに 世界経済フォーラムからジェンダーギャップ指数とかいう使えない指標が発表されて、日の順位は酷い、こういう対策が必要だ、という記事がバズってみんなが憤慨し、年明けにはみな忘れている、という恒例行事が始まりましたね。今年もそんな提言でバズってはダメだろうという記事がバズっていたので、ちょっとこの使えない指標についてくさしておこうと思います。 この手の世界ランキングがどうしようもないものになってしまうのは、世界大学ランキングを事例に現代ビジネスで解説したことがあるのでそちらも是非どうぞ→日人がほとんど知らない「

    ジェンダーギャップ指数とかいう使えない指標と女子教育の話|畠山勝太/サルタック|note
  • ジェンダーギャップ指数2019で集計ミス? 日本は本当は何位だったのか

    12月17日に世界経済フォーラム(WEF)が発表した2019年の「ジェンダーギャップ指数」。世界各国の男女格差を測りランキングにしたもので、日は前年の110位から後退し、過去最低の121位となりました。政治参画の遅れが大きな課題になっています。 日は0.652点で121位に 一方で、このジェンダーギャップ指数について「集計ミス」を指摘する声がSNSで上がっています。前年と比較して、不自然に大きく変化している項目があるのです。 指数は「経済」「政治」「教育」「健康」の4つの大項目の男女平等をそれぞれスコアにしています(1に近いほど男女の格差がない/0に近いほど男性優位に、1を超えると女性優位に格差が大きくなっている)。4つの項目にはそれぞれ小項目が設定されています。 集計ミスが疑われているのが、「教育」のカテゴリー。日は前年は0.994点で65位でしたが、今年は0.983点で91位と後

    ジェンダーギャップ指数2019で集計ミス? 日本は本当は何位だったのか
  • ジェンダーギャップ指数2019、日本は過去最低を更新し121位、G7最低 男女平等はまた後退

    ジェンダー・ギャップ指数は、経済・教育・健康・政治の4分野14項目のデータを元にして、各国の男女の格差を分析した指数。日は、調査対象となった世界153カ国のうち、121位だった。

    ジェンダーギャップ指数2019、日本は過去最低を更新し121位、G7最低 男女平等はまた後退
  • biunit

  • 可視化で理解するマルコフ連鎖モンテカルロ法(MCMC) - ほくそ笑む

    先日行われた第9回「データ解析のための統計モデリング入門」読書会にて、 「可視化で理解するマルコフ連鎖モンテカルロ法」というタイトルで発表させて頂きました。 発表スライドは以下です。 可視化で理解するマルコフ連鎖モンテカルロ法 from hoxo_m この発表は、みどりぼんに登場する、マルコフ連鎖モンテカルロ法(MCMC)のアルゴリズムである「メトロポリス法」と「ギブス・サンプラー」について、可視化して理解しようというお話です。 「マルコフ連鎖モンテカルロ法」というのは、字面だけ見ると難しそうですが、この発表で理解すべきポイントは、次のスライド 1枚に凝縮されています。 このことを念頭に置いて、それぞれの手法を見ていきましょう。 まず、メトロポリス法ですが、これは、 前の状態の近くの点を次の遷移先候補として選ぶ(マルコフ連鎖) そのときの確率比 r < 1 ならば確率 r で棄却する。それ

    可視化で理解するマルコフ連鎖モンテカルロ法(MCMC) - ほくそ笑む
  • 豊田秀樹氏による検定論批判――検定・データ解析・データマイニング

    豊田秀樹『金鉱を掘り当てる統計学 データマイニング入門』というから。示唆的なので、長めに引用。「1.1 統計学の憂」より。※小見出しのゴシックはstrongタグで表現。ルビ、注は省略 検定論の憂 統計的検定論の理論的枠組は,アメリカで活躍した数理統計学者のワルドやレーマンの独創的な業績によって,1950年代に完成してしまっている。極論するならば,それ以後は,その理論の精緻化,および具体的な検定法の開発が続いているだけの状態ともいえる。 ただし,検定法の理論研究の枠組みは,優秀な先人達が練りに練り上げたものなので,一朝一夕に参加できる研究課題ではなくなっていた。理論体系が洗練されたことによって,研究に参加するためには,長期にわたる数理統計学的な「修業」を必要とし,皮肉なことに,そのことが検定を作る側と使う側の明確な分離を生じさせ,実質科学的な要請が検定論に反映されにくい下地を作ってしま

    豊田秀樹氏による検定論批判――検定・データ解析・データマイニング
  • オンラインで無料で読める統計書22冊|Colorless Green Ideas

    はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれたが多いが、日語で書かれたも若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

    オンラインで無料で読める統計書22冊|Colorless Green Ideas
  • オープンデータ情報ポータル

    オープンデータ、データジャーナリズムに関する情報と実験のサイトです。なぜ今、オープンデータか OKFジャパン代表 庄司昌彦氏 政府をはじめ、主に公的機関が保有するデータを再利用可能な形で公開し、新たな価値創造を期待する「オープンデータ」が注目を集めている。すでに国内でもその活用促進を図るいくつかのグループが発足した。そのひとつ「オープン・ナレッジ・ファウンデーション(Open Knowledge Foundation、OKF)」ジャパン代表を務める庄司昌彦氏(国際大学GLOCOM 主任研究員)に、なぜ今オープンデータなのか聞いた。 (2013/02/13) もっと見る » 内閣官房など「オープンデータアイディアボックス」設置 ネットで広く意見募集 内閣官房、総務省、経済産業省は2月1日、オープンデータの活用について広く意見募集するウェブサイト「オープンデータアイディアボックス」を共同で開設

  • 気象庁 Japan Meteorological Agency

    平成26年3月18日にホームページをリニューアルしました。 現在提供している「気象庁について」メニューをご利用ください。 前のページに戻る

  • 有効数字の決め方にもやもやとしたものを感じる人のための説明 - あらきけいすけの雑記帳

    教育用の覚書。今後も加筆、修正する予定。注釈に結構、いろいろと書いている。 スプレッドシート(Excelのような表計算ソフト)を用いた計算例は有効数字の求め方の例題:パチンコ玉の直径をノギスで1回だけ測って体積を求める - あらきけいすけの雑記帳に書いた。 有効数字とは、有効数字を求める趣旨 まず有効数字とは「(何かを)はかる」ことに伴うもので、「このはかりではここまで値が分かる(これ以上の細かいことはわからない)」ということを示すもの。(だから何をどう測ったのか分からない数値だけが書かれた理科の計算問題で、有効数字を求めようとする神経が分からない。) 有効数字を求める趣旨はその測定で知り得たことと知り得ないこと(知り得ない数を書くことは、読者をミスリードするという悪事だ)をはっきり区別し、エビデンス(はっきりと知り得たこと、証拠、根拠)を蓄積することである。知り得たことと知り得ないことの

    有効数字の決め方にもやもやとしたものを感じる人のための説明 - あらきけいすけの雑記帳
  • 三次元散布図をRで描くのに画期的な新機能がRGLパッケージに加わった - ほくそ笑む

    以前、三次元散布図をRで描いてみたという記事で紹介したRGLパッケージに画期的な新機能が加わったので紹介します。 (情報源:R: Interactive 3D WebGL plot of time-space cube with RGL | geolabs) RGLパッケージの良いところは、3次元プロットをマウスドラッグでグリグリ動かせるところなのですが、いざ、ファイル出力しようとすると、静止画か動画でしか保存できず、インタラクティブな3次元プロットをそのままファイルに保存することができないというのが欠点でした。 しかし今回、新機能として、WebGL で動く HTML ファイルとして保存できる機能が付加されたようです。 さっそく試してみましょう。 install.packages("rgl") library("rgl") data(trees) plot3d(trees) writeWe

    三次元散布図をRで描くのに画期的な新機能がRGLパッケージに加わった - ほくそ笑む
  • 「子供に解けて大人に解けない問題」を統計的に無理やり解いてみた - ほくそ笑む

    今日は、R-bloggers に面白い記事が上がっていたので、それを紹介してみようと思います。 問題 「子供にはすぐに解けて、大人にはなかなか解けない不思議な問題」をご存知でしょうか? 最近ネットで割と話題になりました。 その問題は、次のようなものです。 8809 = 6 7111 = 0 2172 = 0 6666 = 4 1111 = 0 3213 = 0 7662 = 2 9312 = 1 0000 = 4 2222 = 0 3333 = 0 5555 = 0 8193 = 3 8096 = 5 7777 = 0 9999 = 4 7756 = 1 6855 = 3 9881 = 5 5531 = 0 2581 = ? https://twitter.com/#!/yappyJP/statuses/172086299099004928 なかなか面白い問題です。 答えはここでは書きませ

    「子供に解けて大人に解けない問題」を統計的に無理やり解いてみた - ほくそ笑む
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 主座標分析について簡単に紹介するよ! - ほくそ笑む

    今日は主座標分析(Principal Coordinate Analysis; PCoA)の紹介を簡単にしたいと思います。 主座標分析は古典的多次元尺度構成法(Classical Multidimensional Scaling; CMDS)とも呼ばれる統計解析手法です。 この解析手法を使用する主な目的は、高次元のデータを2次元や3次元に落として視覚化したいという時に使います。 以前紹介した主成分分析と同じような感じですね。*1 主成分分析との違いを簡単に言うと、主成分分析はユークリッド距離をなるべく保ちながら低次元に落とす方法ですが、主座標分析はユークリッド距離だけでなく、他の距離や類似度*2が使えるという点にあります。 例えば、ユークリッド距離の代わりに相関係数を使えば、相関の高いもの同士が近い配置になるようなプロットを作ることが可能です。 データを用意する さっそくやってみたいのです

    主座標分析について簡単に紹介するよ! - ほくそ笑む
  • https://www.mbsj.jp/admins/ethics_and_edu/PNE/6_article.pdf

    tsutatsutatsuta
    tsutatsutatsuta 2012/03/09
    "統計を行なうにあたっての土台となる根本的な考え方" 分子生物学,生化学,細胞生物学における統計のポイント (PDF)
  • Using Text Mining to Find Out What @RDataMining Tweets are About

    This post shows an example on text mining of Twitter data with R packages twitteR, tm and wordcloud. Package twitteR provides access to Twitter data, tm provides functions for text mining, and wordcloud visualizes the result with a word cloud. If you have no access to Twitter, the tweets data can be downloaded as file “rdmTweets.RData” at  http://www.rdatamining.com/data, and then you can skip the

    Using Text Mining to Find Out What @RDataMining Tweets are About
  • spider: SPecies IDentity and Evolution in R

    Spider: SPecies IDentity and Evolution in R, is a new R package implementing a number of useful analyses for DNA barcoding studies and associated research into species delimitation and speciation. Included are functions essential for generating important summary statistics from DNA barcode data, assessing specimen identification efficacy, and for testing and optimising divergence threshold limits.

  • フラクタルビスケット、ポアソンスパゲッティ - 小人さんの妄想

    フラクタルの語源は 「ラテン語の動詞frangereは『壊れる』、すなわち不規則な断片ができるという意味」 なのだそうです。 >> http://www.biwa.ne.jp/~k-tochi/siryou/siryofra.html それでは、実際にものを壊したときの破片は、どのような大きさに散らばるのでしょうか。 岩石に衝撃を与えて破壊するとその破片の大きさの分布はベキ分布になることが知られています。 ガラスのコップを硬い床に落として割った時にできる破片も同じです。 大きな破片はほんの数個で、中くらいの破片はかなりの数になり、小さな破片は無数にあります。 -- 経済物理学の発見(光文社新書)より. 試しにやってみようと思ったのですが、岩石を割るのはたいへんだし、ガラスのコップを割るのはもったいない。 簡単に割れるものを探してみたところ、戸棚の中にビスケットがありました。 小袋の中に入っ

    フラクタルビスケット、ポアソンスパゲッティ - 小人さんの妄想
  • 多変量解析の基礎知識:リサーチソリューション | マクロミル

    調査結果をより深く理解するために様々な解析やデータ可視化のための手法・ツールをご用意しています。 専門のリサーチャー・アナリストが調査目的に応じて幅広い手法から最適な手法をご提案、サポートいたします。

    多変量解析の基礎知識:リサーチソリューション | マクロミル
  • 高速な復元抽出の直感的な説明

    先日@niamさんと@tsubosakaさんのつぶやきを見てて,確率{pi}で復元抽出するWalker's alias methodというものを知りました.たまたま,今日,復元抽出する用事があったので,思い出して調べた次第.私も昔同じことをやろうとして,O(log n)でいけるからまぁいいやと思っていたのですが,このアルゴリズムだとO(1)でいけます. 解説はこのあたりのブログを参照. 比較的高速な復元抽出アルゴリズム高速に非復元抽出をするアルゴリズムはないだろうか?(2)さて,私は理解力が足りなくてこのあたりの説明を読んでもなんでこれでいいのかさっぱりわからなかったので,絵に描いて理解しました.確率{pi}で復元抽出するためには,piに比例した面積の図形を壁に貼ってダーツをすればいいのです.{0.1, 0.05, 0.3, 0.1, 0.45}だったとします.するとこんなの. まさか毎回

    高速な復元抽出の直感的な説明