タグ

統計に関するgarlicgunのブックマーク (65)

  • 「子宮頸がんで人は殆ど死なない」のか? - NATROMのブログ

    喫煙の害を過小評価しようとしているのか、「肺がんで死ぬのは10万人に80人、約0.08%である。タバコが肺がん死を数倍増やすとしてもたかがしれている」といった主張を散見する。10万人に80人というのはおそらく、日人男性の肺がん粗死亡率からきている。つまり日人男性10万人につき年間で約80人が肺がんで死亡している。 0.08%を大したことがない数字だと思われるか。しかし、肺がんは日の部位別がん死亡の第一位である。1995年ごろに胃がんを抜きトップに躍り出た。肺がん死がたいしたことがないなら、他の病気もおおむね大したことがないことになってしまう。 ポイントは、死亡率の分母は日人男性全体で、死亡する確率が小さい若年者まで含めた数字であることと、そして何より、一年間あたりの数字であることだ。一生涯ならもっと数字は高くなり、日人男性100人のうち肺がんで死亡するのは約6人、つまり日人男性

    「子宮頸がんで人は殆ど死なない」のか? - NATROMのブログ
  • データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう!|ハイクラス転職・求人情報サイト AMBI(アンビ)

    データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう! ビッグデータ、データサイエンス、人工知能など、統計学を主軸においた分野が隆盛ですが、統計学には高いハードルを感じる方も少なくないでしょう。k平均法を実際に手を動かしながら理解することで、データ分析を身近に感じることができます。 はじめまして、藤井健人(@studies)と申します。イタンジ株式会社でデータ基盤周りの運用を担当しています。 「ビッグデータ」「データサイエンス」「人工知能」といったバズワードに代表されるように、統計学を主軸においた分野の隆盛が日常となって久しいです。 しかし「統計学は学問的な要素があり難しい」という印象を持たれやすく、「実務に活かすのはハードルが高い、怖い」と感じる方も少なくないのではないでしょうか。 そういった方を対象に、今回は統計学の手法の一つであるk平均法を学んでいただ

    データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう!|ハイクラス転職・求人情報サイト AMBI(アンビ)
  • 統計検定を理解せずに使っている人のために II

    408 化学と生物 Vol. 51, No. 6, 2013 15 μ σ μ σ μ σ 16 セミナー室 研究者のためのわかりやすい統計学-2 統計検定を理解せずに使っている人のために II 池田郁男 東北大学大学院農学研究科 15 16 409 化学と生物 Vol. 51, No. 6, 2013 μ σ σ σ μ σ * 17 μ σ μ σ * μ μ μ Z n 1 1 = − ( ) X µ σ σ 18 μ σ σ σ σ σ μ σ μ μ μ σ / n σ / n σ / n σ / n * * 17 18 σ 410 化学と生物 Vol. 51, No. 6, 2013 t u n 1 1 = − ( ) X µ σ σ σ σ σ μ t X 1 1 = − ( ) µ SE 19 μ μ μ μ μ 20 μ σ μ μ σ μ μ u n / 19 20 4

  • マンガで超読みやすい確率統計のオススメ参考書たち

    こんにちは,現在,確率統計学の授業を履修中ブロガーの迫です! 確率統計学って,現代においてめちゃめちゃ重要だし,統計とか検定のスキルがあれば普通にべていけると思うんですよ. しかし,大学で習う統計の内容は数式にまみれすぎてて結局なにをしているのか僕にはよく理解できませんでした 授業は理解できなかったとはいえ,これだけ様々なデータが溢れ,AI技術が進歩する現代において,多少の統計リテラシーは必要であるため,とりあえず統計学の基礎だけでもしっかり学んでみることを決意したんです. そこで私が読んでみようとしたのは,少し前に話題になったこの

    マンガで超読みやすい確率統計のオススメ参考書たち
  • マーケター必見! 総務省の「統計ダッシュボード」のスゴい充実度

    総務省はこのほど、国勢調査や経済センサスなど国勢に関する統計データを「統計ダッシュボード」というウェブサイトにまとめ、公開をはじめた。総務省がもつ統計データを、表示する数値やグラフを動的に切り替えられるグラフィカルなシステムと組み合わせることで、広く活用してもらうことが目的だ。これが非常によくできているのだ。 「統計ダッシュボード」では、約5000の統計データを「人口・世帯」「労働・賃金」など17の分野に整理して収録。グラフは全部で55種類あり、サイト上で関連データの追加や削除、時系列比較や地域間比較などが可能となっている。 総務省のリリースによれば、特にビジネス(民間)での利用について「オープン化された公的データを地域やビジネスの視点から活用し新たなアイデアを創出」することを狙いとしている。

    マーケター必見! 総務省の「統計ダッシュボード」のスゴい充実度
  • 1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py

    前回の「ゲームプログラマからデータサイエンティストに転職しました」 の記事でもお話したとおり、5月からデータ解析する人になりました。 とはいえ、データ解析に関しては未経験。 少しでも不安を減らすために、4月の有給消化期間は統計学のお勉強しました。 今回はおすすめしてもらった中で読んで良かったの紹介、そして読んだの簡単なまとめを書いて行きたいと思います。 ※前提: 4月時点の自分の知識に関して 自分は大学は情報科学を専攻していたが、難しい数式は苦手 統計学は1コマ分受講していたが、単語を覚えている程度でかなりあやうい まず一番最初に読みたい 「完全独習 統計学入門」 「簡単に統計学の全体像がつかめる入門書はないか」とTwitter相談したら、こちらのを数名の方が薦めて下さった。 完全独習 統計学入門 作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2006/09/28メ

    1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py
  • 標準偏差とは何か!その求め方と意味を図解で徹底解説

    ここでは高校数学で登場し、統計学を学ぶ上でとても重要な役割を担う「標準偏差」について、図解を駆使し、その求め方と意味について解説していきます。 標準偏差の求め方や意味を理解するには、以下の4つのSTEPを踏めば簡単に理解することができます。 標準偏差は「式を覚える」のではなく「イメージ化」することがとても重要です。 4つのSTEPを質的なイメージで捉えることで「標準偏差とは何か」や「標準偏差はどうやって求めるのか」がスッキリ頭に入ってきますので、ぜひ最後までお付き合い下さい。 標準偏差の求め方 標準偏差を求める式がこちらになります。 いきなりかなり難しい式が登場してきました(汗 この式を覚えることはなかなか厳しいですよね。 ただ、この式の記号のひとつひとつをイメージ化しながら読み解くことで、この難しい式が実はとてもストーリー性のある面白い構造をしていることが分かってきます。 ここではその

    標準偏差とは何か!その求め方と意味を図解で徹底解説
  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
  • 整然データとは何か|Colorless Green Ideas

    整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。 はじめに データ分析の際には、データが扱いやすい形式になっている必要がある。データの中身がぐちゃぐちゃになっていたり、データの形式が統一されていなかったりすれば、分析は骨の折れる作業となる。 それでは、どのようなものがデータ分析において扱いやすい形式のデータになるのだろうか。この問題に対する唯一の正しい解答というものは存在しない。しかし、表の形式で表すことができるデータを考える場合、ハドリー・ウィッカム (Hadley Wickham) 氏が提唱した整然データ (tidy d

    整然データとは何か|Colorless Green Ideas
  • 企画書の説得力が上がる!統計調査レポートサイトまとめ|【公式】ModuleApps 2.0

    企画書や提案書の作成中「こんな調査結果があったら、もっとインパクトの強い企画書が作れるのに」「こんな裏付け資料があったら説得力が上がるのに」と思ったことはありませんか?今回はWeb系企画書作成に役立つ統計調査や資料をチェックできる調査レポート系のサイトをご紹介します。 モバイル関連の調査結果をチェックできる「MMD研究所」 MMD研究所は、スマートフォンやタブレットの消費者動向や市場調査、そして通信キャリアの満足度調査など、モバイルビジネスに関する調査データを無料で発表しているサイトです。 MMD研究所にアクセスするとすぐに理解できますが、様々なモバイル関連の調査資料が1週間間隔で定期的にアップされています。そのため、モバイル系のサイト構築、アプリ開発などのプレゼンテーション時などに役立つこと間違いなしのイチオシサイトといえます。 調査資料のカテゴリも幅広く、モバイルコンテンツの市場動向、

    企画書の説得力が上がる!統計調査レポートサイトまとめ|【公式】ModuleApps 2.0
  • 【保存版】一次情報をゲットするために確認するべきウェブサイトをまとめてみました(随時更新) - とある浪速の調査雑記

  • 日本の深刻な殺人離れ

    須藤玲司 @LazyWorkz うちの親がニュース見ながら「最近は殺人が増えとるなあ…昔よりもずっと。こわいわあ」とか寝言ぬかすんで、ちょっと待てババアあんたらの時代よりおれらの時代のほうがずーっと日は良くなっとるんや、殺人なんか8割減やでと数字を見せつける朝。 pic.twitter.com/KqCTGeyLr1 2016-09-14 08:08:43 須藤玲司 @LazyWorkz 「昔は殺人のニュースなんか珍しかったのに」 「そら昔は殺人が珍しくなかったからやろ。珍しくないことなんかわざわざニュースにしないし、聞いても忘れるがな」 pic.twitter.com/JjUNhzNLG2 2016-09-14 08:19:35 須藤玲司 @LazyWorkz 他殺死亡者数グラフ、おまけの自殺者数のほうに「こんなに多いのか!」って驚く声がありますが、むしろ驚くほど少ないんですよこれ。 「

    日本の深刻な殺人離れ
  • “ゲーム開発者の生活と仕事に関するアンケート2016”調査の速報版データが公開。経験年数は「9年以下」が増加,平均年収は28.3万円の下落

    ゲーム開発者の生活と仕事に関するアンケート2016”調査の速報版データが公開。経験年数は「9年以下」が増加,平均年収は28.3万円の下落 編集部:早苗月 ハンバーグべ男 コンピュータエンターテインメント協会は日(2016年8月23日),CEDEC 2016に関して実施した“ゲーム開発者の生活と仕事に関するアンケート2016”調査の速報版データを公開した。 今回の結果では,“ゲーム産業の経験年月数”で「9年以下」の解答,“最終学歴の学問系統”で「芸術・表現・音楽・デザイン系」の解答に大きめの増加が見られたとのこと。また,平均年収は昨年から28.3万円の下落となっている。なお今回の有効回答数は昨年比で約10倍となっており,例年よりも実態に則したデータが得られているとのことだ。 CEDEC 2016 「ゲーム開発者の生活と仕事に関するアンケート2016」調査 速報 最終学歴は大学および大学

    “ゲーム開発者の生活と仕事に関するアンケート2016”調査の速報版データが公開。経験年数は「9年以下」が増加,平均年収は28.3万円の下落
  • Pythonで統計学を学ぶメリットは?勉強の手順も解説

    Pythonで統計学を勉強するメリット 統計学を学ぶにあたって、Pythonを利用するメリットを確認しておきましょう。 近年の統計業務は、Pythonを使ったアプリケーションで行うケースが増えており、Web上のノウハウや書籍が充実しています。これらを活用することで、統計学の知識が乏しい状態でも、Pythonを切り口として学習を進めやすくなっています。 煩雑な計算を省略できる Pythonは科学計算処理に必要なライブラリが充実しています。Pythonのライブラリには、統計で用いられる専門的な計算式が内包されており、基礎的な考え方さえ理解していれば、具体的な計算式を知らずとも実践的な統計を実行可能です。もちろん読書や座学でも学習は可能ですが、Pythonを利用することで「煩雑な計算の理解」に時間を取られずにすむため「統計を使ってできること」をダイレクトに理解し易くなるでしょう。 データが簡単に

    Pythonで統計学を学ぶメリットは?勉強の手順も解説
  • 企画書で使える!無料で統計データが手に入るサイト11選|SUKIMANO

    市場調査の結果など、客観的な統計データがあると企画書やプレゼン資料の信頼感がぐっとアップしますよね。 しかし、統計データを企画書やプレゼンの資料として使いたいと思っても、個人でできる調査には限りがありますし、格的に調査するとそれなりに費用や時間がかかるのがネックです。 実はネット上には無料で統計データを公開しているサイトがあるので、企画書やプレゼンのテーマに沿った資料が手に入るなら活用しない手はありません。 無料で統計データが閲覧できるサイトを11個まとめましたので、企画書やプレゼンの資料に活用してみてはいかがでしょう。 ①総務省統計局 出典 http://www.stat.go.jp/index.htm 統計データといえば総務省統計局です。 国勢調査、人口推計、住宅・土地統計調査、家計調査、全国消費実態調査、小売物価統計調査、労働力調査などなど、さまざまな統計データを無料で閲覧できます

    企画書で使える!無料で統計データが手に入るサイト11選|SUKIMANO
  • 5割が一度やめた課金ゲームアプリを再開。そのきっかけは?MMD研究所調べ|【公式】ModuleApps 2.0

    4割が「課金するタイトルを1つに決めている」 「並行して課金しているタイトル」について質問しました。「課金するタイトルは1つに決めている」が39.9%、次いで「2タイトル並行して課金している」が35.1%となりました。 約4割がタイトルを1つに決めており、3割以上が2タイトル並行して課金している結果となりました。 どうしても欲しいキャラがあって課金する 「ゲームを課金する動機」について質問しました。最も多かったのは「どうしても欲しいキャラがある(グラフィックが好み)」で53.8%、次いで「どうしても欲しいキャラがある(イベントを有利に進める強キャラ)」が37.2%、「何に課金するかは決まっていないが、キャンペーン(値引き・特別販売等)の時だけ狙って課金」が22.3%となりました。 ゲームをやめてしまった理由とは? 「課金してきたゲームをやめてしまった理由」について質問したところ、最も多かっ

    5割が一度やめた課金ゲームアプリを再開。そのきっかけは?MMD研究所調べ|【公式】ModuleApps 2.0
  • 「ヤフコメ」と「はてブコメント」の違い。テキストマイニングより見えてきたもの - プリキュアの数字ブログ

    プリキュアにあんまり関係ない記事です。興味ない方はスルーして下さい。) 先日(4/13)、当ブログを紹介していただいた朝日新聞withnews様の記事が、(数時間ですが)ヤフーのトップに掲載されました。 娘がプリキュアに追いついた日… 父のブログに涙する人が続出 当たり前の日常の中にある愛情、著者に聞く (withnews) - Yahoo!ニュース さすがにヤフーのトップ、記事中に直接リンクが貼ってあったわけではありませんが、多大な反響があり、その1日だけで「イワオ~キン骨マンの超人強度」くらいにはPVを頂きました。 はてなブックマーク、ツイッター含め、沢山のコメントを頂きまして、当にありがとうございました。 すべてのコメントを読まさせていただきました。 その全てが、ありがたく、身に染みるものでした。 で、今回「ヤフーのトップニュースに載る」ことにより、 「自分のブログ記事の内容が”

    「ヤフコメ」と「はてブコメント」の違い。テキストマイニングより見えてきたもの - プリキュアの数字ブログ
  • エラーページ - ヤフー株式会社

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    エラーページ - ヤフー株式会社
  • Webマーケティング・運用型広告のターゲティングやペルソナの参考になる統計資料サイトまとめ|アナグラム株式会社

    私たちマーケティング活動に従事する者は、しばしば過去の統計やデータを根拠にして施策を実施すること、クライアントに提案をすることがあります。アナグラムに所属する現場のマーケターはどんなサイトを見ているのか?ということを記事で紹介します。 ※2016年3月15日追記 統計:経済・産業・法人系の項目に「出店戦略情報局」を追加しました マーケターにとっては、統計が仮説立ての一助になれば十分 統計とは、「(人・物・出来事の)ある集団について、その特性を数量的に測って得られる数値」です。統計資料を作ることを仕事にしている方は、それこそ信頼性・妥当性があり有意で100%に限りなく近しい正確なデータの収集・整理・開示が求められます。 一方で我々のようないわゆるマーケター、統計資料を使う・利用する側の人間はそれが意思決定の一助になればいいので、必ずしも100%正確な数字を把握し取り扱う必要はないでしょう。

    Webマーケティング・運用型広告のターゲティングやペルソナの参考になる統計資料サイトまとめ|アナグラム株式会社
  • 競馬の解析をガチでやったら回収率が100%を超えた件 - stockedge.jpの技術メモ

    記事のタイトル通り、競馬で回収率100%を超える方法を見つけたので、その報告をする。 ちなみに、この記事では核心部分はぼかして書いてあるため、読み進めたとしても「競馬で回収率100%を超える方法」が具体的に何なのかを知ることはできない。(私は当に有効な手法を何もメリットが無いのに公開するほどお人好しではないので) 当に有効な手法を見つけたいのであれば、あなた自身がデータと向き合う以外の道は無い。 ただし、大まかな仕組み(あと多少のヒントも)だけは書いておくので、もしあなたが独力でデータ解析を行おうという気概のある人物なのであれば、この記事はあなたの助けとなるだろう。 ちなみに、これは前回の記事の続きなので、読んでない方はこちらからどうぞ。 stockedge.hatenablog.com オッズの歪みを探す さて、前回からの続きである。 前回の記事のブコメで「回収率を上げたいならオッズ

    競馬の解析をガチでやったら回収率が100%を超えた件 - stockedge.jpの技術メモ