タグ

統計に関するtakeodonのブックマーク (16)

  • 年収を偏差値化した世界

    年収を偏差値で表すと、どんなことが起きるのでしょうか。 「偏差値」という統計量は、受験戦争を通じて日社会に定着しています。 私も受験期にはこの言葉が大嫌いでした。 受験業界ではもはやなくてはならない統計量になっている偏差値ですが、その数値の高低のみで進学先を決定する風習から偏差値至上主義を生み出し、”悪の元凶”のように目の敵にされてしまっている一面があります。 実際、偏差値に振り回されて嫌な思いをされた方も多いのではないでしょうか。 しかし、これだけ長きに渡り、日の受験業界に君臨している指標ですから、使い方次第で大きな恩恵を手にできる優れた面も持ち合わせているはずです。 一方で、この偏差値という数値指標は、受験生時ほぼ毎日のように耳にし、その数値を意識して過ごしていきますが、一旦入試を終え、社会に出ると耳にする機会はほとんど無くなります。 社会人になると自分自身の客観的な立ち居地を把握

    年収を偏差値化した世界
  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
  • トップページ - RESAS 地域経済分析システム

    地域経済分析システム(RESAS:リーサス)は、地方自治体の様々な取り組みを情報面から支援するために、内閣官房デジタル田園都市国家構想実現会議事務局が提供する、産業構造や人口動態、人の流れなどの官民ビッグデータを集約し、可視化するシステムです。

    トップページ - RESAS 地域経済分析システム
  • 重回帰分析

    Excel:重回帰分析(3)・・・分析ツールの使い方,説明変数の選び方 ここでは,学的に厳密なことは望まず,仕事や研究で報告書を半日程度でまとめなければならない人を念頭に置いて,大筋の説明を目指す.重回帰分析自体に使える時間として,は30分~1時間程度を想定する.(もっと詳しい説明が必要な人は下端に参考資料を示す.) ■Excelの分析ツールの使い方■ 次の例では,冷蔵庫の「実勢価格」(目的変数)を「総容量L」「ドア数(個)」「冷蔵室L」「冷凍室L」「野菜室L」「製氷室L」(説明変数)で表わす重回帰式を求めることを当面の目標とする. 次の図のように目的変数(被説明変数,従属変数)がA列にあり,説明変数(独立変数)がB~G列に入力されている場合を例に解説する. 操作方法は、下の[前の操作][次の操作]ボタンを順次押せば表示される.(データの出所:2007.3.18に価格.com>スペック検

  • 人口減少地図:日本経済新聞

    民間の日創成会議(座長:増田寛也元総務相)が全国の市区町村の半数を人口減少によって「消滅可能性がある」と発表、地方自治体などに衝撃が広がっています。「人口減少地図」は創生会議や総務省の関連データを市区町村ごとにマッピングしました。お住まいの自治体やふるさとの「危機」がひと目でわかります。

    人口減少地図:日本経済新聞
  • 社会実情データ図録 : 図録▽未婚率の推移

    年齢別の未婚率の推移を、男女別に、20歳代後半、30歳代前半、そして50歳時(いわゆる生涯未婚率(注))について、大正9年(1920年)の第1回国勢調査から示した。 (注)50歳時の未婚率(実際は45~49歳の未婚率と50~54歳の未婚率の平均から算出される)は、その後に結婚する人は少ないことから、「生涯未婚率」と称されている。 なお、ここでの生涯未婚率は、死亡者数に占める未婚者の割合ではない点に注意が必要である。 ちなみに、2020年の国勢調査による生涯未婚率(配偶関係未詳を除く人口に占める未婚者の割合)は男性が25.7%、女性が16.4%であるのに対して、2020年の人口動態統計によれば15歳以上の死亡者数に占める未婚者の割合は、男性11.1%、女性6.7%となっている。前者が現在の40~50代の状況を示しているのに対して、死亡数が多い80~90代の男女は皆婚慣習が成立していた時代の人

  • データサイエンティストに必要な3つのスキル | quipped

    久しぶりにタイトルで釣りにいっているが、ブラウザの「戻る」ボタンを押さないでくれw ... ... ... (よし、まだ「戻る」ボタンを押してない!) ぼく自身、データサイエンティストだったことはないが、一応大学では数学を勉強していたし、金融でクオンツトレーダーもやっていたし、人生3回分(と言ったら言い過ぎか)くらいのSQLクエリは書いている。なので、これから書くことは、屋に立ち並ぶ歯の浮く様なビッグデータ談義よりは、普遍的な価値があると自負できる。 もう一つ題に移る前に、「データサイエンティスト」という呼称について感じる両価的な感情について軽く説明したい。 ぼくは幸いにも優秀な同僚や友人に恵まれていて、彼らの中には、データ分析屋さんでありながら、データを集めてきて(広義の)データウェアハウスに突っ込むという非常に面倒くさい一連の作業もちゃっちゃか出来る奴が2、3人いる。そういうマルチ

  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • WEBで読める統計関係の良質な資料 - Interdisciplinary

    私がよく参考にする所を三箇所紹介します。いずれも、説明が極めて明瞭で、論理的な整合性や用語の丁寧な使い方を志向している所に好感が持てるサイトです。 ▼Econom01 Web Site, Sophia University, Tokyo, Japan 上智大学の大西博氏のサイト。私が統計関連で最もよく参照する所です。説明の仕方の明瞭さや、具体例を用いた解説がとても良いと思います。確率統計の一つ一つの概念について、大変丁寧に説明されています。たとえば、「相関(および因果関係)」については、 2つの変数の同時分布と、その条件付き分布は、変数の間の数量的結び付きを示しています。この数量的結び付きは、統計的頻度分布として観察されるものであり、現象の背後にある実態的な「関係」や「構造」から導かれる法則性を必要としません。 例えば、人間の身長と体重とは密接な統計的分布関係を持っていますが、両変数を決定

    WEBで読める統計関係の良質な資料 - Interdisciplinary
  • 女性を無視したマーケティングがどれだけ痛いかがわかるデータたち – TechDoll.

    どんどんパワーアップしていく女性たち。女性の収入はどんどん上がっているし、家庭でお財布の紐を握っているのも女性。そんな女性を理解するためのデータがTheNextWebにあったので紹介するよ。 米国では、購入判断の85%を女性が決めたり影響したりしてるそう。従来の男性商品に関しても、その50%以上を女性が購入している。その一方で、女性の91%が、マーケターや広告主は自分たちを理解していないと回答してる。 収益力 1. 平均的なアメリカ人女性の収入は2028年には男性を上回ると予測されている 2. 米国の私有財産の51%が女性によってコントロールされている 3. 米国の持ち株制度の50%以上が女性によって保持されている 4. 米国の個人資産の60%以上を女性がコントロールしている 女性の購入パワー 5. 自動車からヘルスケアまで、消費者購買の85%は女性によって行われている 6. ヘルスケア関

    女性を無視したマーケティングがどれだけ痛いかがわかるデータたち – TechDoll.
  • 統計学を勉強するときに知っておきたい7つのポイント

    マイクロソフト社が技術分野でもっと熱い専攻の一つとして分析/統計をあげている(Microsoft JobsBlog)。同社以外でも統計学は、今後最も有益なスキルの一つだと考えているようだ(NYT - For Today’s Graduate, Just One Word: Statistics)。しかし、データマイニングの話も一般化しつつあって学習ノウハウなども公開されているが、経験にあわない部分が多い。統計学を初めて勉強するときに知っておいた方が良い7つのポイントをあげてみた。 1. 学習機会やテキストは山のようにあるので利用する 確率・統計の日語テキストは山のようにあり、大学のコースワークを振り返っても、理文問わずにほとんどの学部で確率・統計はあったはずだ。大学院のコースワークでは英語の文献を好む傾向があるが、上級テキストでも日語のものも少なくない。また「マンガでわかる統計学」のよ

    統計学を勉強するときに知っておきたい7つのポイント
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 市場規模一覧(多分、永遠に未完成) - Chikirinの日記

    いろんな業界の市場規模を知りたいなーと思うのだけど、バシッとした一覧表が見つからない。データはあそこにある、ここにあるという人は多いけど、じゃあ、この業界は○兆円ですよ、教えてくれる人は少ない。ので、自分で作ってみた。 とりあえずこのサイトの数字をベースに作ったんだけど、普通にググッてでてくる数字と大きくかけ離れている場合もあるんで、他の情報もいろいろ勘案してます。 自分用のメモなんで中途半端かつ超適当です。感覚的に「んっ?」な数字もあるので信じないように。適宜、直します。気長にやるつもり。10年計画くらいで。 どれかについて知ってる方、ツイッターやブックマークなどで教えて頂けると感謝です。ただし、台とかケースとかトンとか興味ないです。金額が知りたい。数千億未満の市場は割愛。「市場規模ってなにさ?」という質問はボツ。 そんじゃーねー ★★★ <乗り物関連> ・自動車 44兆円(自動車メーカ

    市場規模一覧(多分、永遠に未完成) - Chikirinの日記
  • 生還した戦闘機が教えてくれること ~ 選択バイアスの罠 - Feel Like A Fallinstar

    久しくご無沙汰しておりました。 書くネタ自体は山ほどあるんですが、業が凄い勢いで動いているのでそっちに集中していましたです。 さて、たまには分析チックなお話を。統計でガチガチの石頭になってしまわないように、常に僕が気をつけていることの1つが「選択バイアスの罠」です。 生還した戦闘機、しなかった戦闘機 あ、ちなみに、いまきは別に統計や分析の(アカデミックな意味での)専門家ではないので、そのあたりはご容赦を(汗 時に1940年ごろ。 世界は第二次世界大戦の真っ只中です。 統計学者のエイブラハム・ワルドという方が戦闘機の脆弱性について調査していたそうです。 帰還した戦闘機の大量のデータが彼の元に届きます。 「入手したデータどれもが、戦闘機のある部分の被弾頻度が他の部分よりも過度に多いことを示していた。」 さて、ここからどういう結論を導けばいいのでしょうか? (ちょっと立ち止まって考えてから読ん

  • 年収ラボ-最新の平均年収・給料・賃金動向を調査-

    100以上の業界と3,500を超える企業の年収データを平成26-27年版に更新。 気になる業界や企業をランキング形式で掲載。各企業ページには平均年収をはじめ、売上高や利益推移のグラフも掲載。 17.07.03 下記コンテンツを更新しました。 更新!有効求人倍率の推移(5月分) 更新!完全失業率の推移(5月分) 17.06.05 下記コンテンツを更新しました。 更新!有効求人倍率の推移(4月分) 更新!完全失業率の推移(4月分) 17.05.01 下記コンテンツを更新しました。 更新!有効求人倍率の推移(3月分) 更新!完全失業率の推移(3月分)

  • 社会実情データ図録 Honkawa Data Tribune

    米国大統領選におけるハリス、トランプ両候補については支持層の違いが余りに対照的な点が注目される。男女の違いが最も大きいが、白人vs非白人、富裕層vs貧困層、退役軍人vs労働組合員なども目立っている。

  • 1