タグ

統計学に関するfrascaのブックマーク (25)

  • 統計を勉強するときに数学に悩まされる人のための一冊|Colorless Green Ideas

    統計の勉強を始めるときに数学でつまづくことがある。そういったときに『統計学のための数学教室』というが役に立つ。 統計を勉強しはじめたものの、統計が結局よく理解できなかったという人は少なくない。統計の勉強がうまくいかない理由にはさまざまなものがあるが、1つの大きな理由として、統計の教科書に載っている数式が分からないというものがある。数学についてよく知らないと、統計の教科書の数式に悩まされ、統計をしっかり理解できない。統計の考え方の多くの部分は、数学の言葉で書かれているので、数学が分からなければ、統計を理解することができないのだ。 私が前に統計を教えたときは、まず数学をしっかり勉強してもらうところから始めた。統計の入門書に書いてある数式を読むのに必要な数学の知識を身につけてもらったのである。実際そうすることで、統計についてしっかり理解してもらうことができたと思う。そのときは自作の小冊子をつか

  • 文系でもわかる、使える「データ分析・図表作成」術[3]相関と単回帰分析

    ブームの統計学をかじってみたが、仕事での使い方がわからない──。そんな悩み、ありませんか?  例題を解きながら、その活用法を解説します。 相関と単回帰分析 社長はびっくり! 目標設定、費用対効果シミュレーション 【例題】新規部門の立ち上げ、成功なら大抜擢 社長室へ来るようにとの内線電話が入り、ドアをノックしました。「君の仕事ぶりは聞いている。わが社ではより競争力を高めるために、品質向上部をつくることにした。呼んだのはほかでもない。君にその部長を任せようと考えている」。社長は続けます。「配達遅れの問題を徹底的に分析して、部門における具体的な数値目標を立ててもらいたい」。次の用事がある。社長はそう言うと部屋を出ていきました。 あなたはさっそく、社内にあるデータを探しました。配達に関連するデータA(図参照)は見つかりましたが、それらをどう使って、論理的に何が言えるのかわからなくなってしまいました

    文系でもわかる、使える「データ分析・図表作成」術[3]相関と単回帰分析
  • 【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita

    統計をこれから学ぼうという方にとって、非常に重要な概念ですが理解が難しいものに「標準偏差」があると思います。「平均」くらいまでは馴染みもあるし、「わかるわかるー」という感じと思いますが、突如現れる「標準偏差」 の壁。結構、この辺りで、「数学無理だー」って打ちのめされた方もいるのではないでしょうか。 先にグラフのイメージを掲載すると、下記の赤い線の長さが「標準偏差」です。なぜこの長さが標準偏差なのか、ということも解き明かしていきます。 (code is here) 記事では数学が得意でない方にもわかるように1から標準偏差とはなにか、を説明してみようという記事です。 数式はわかるけど、イマイチ「標準偏差」の意味わからんという方にも直感的な理解がしてもらえるような説明もしていきますので、ぜひご覧ください。 (※ この記事では標準偏差の分母に $n$を使用しています。$n-1$を使用するケースも

    【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • Rでデータ分析・統計学・機械学習・データマイニングを学ぶならこの10冊で(2015年2月版) - 渋谷駅前で働くデータサイエンティストのブログ

    今週はまともなデータ分析やら統計学やら機械学習やらの記事を書くのが面倒になったので*1、しばらくやってなかったお薦め書籍リストでも書こうかと思います。 今回まとめるリストは、ズバリ「Rでデータサイエンス・統計学・機械学習を学ぶための10冊」。Rと言えばこのブログのメイン言語なので特に説明は要さないでしょう。去年1年間は拙著も含めてR絡みのが大豊作で、以前のお薦め書籍リストに比べるとRの良書が増えたという部分もあり、そう言えばRだけでリスト作れるなぁと思ったのでした。 というわけで、主に僕が持っているor読んだことがあるを中心にお薦めリストをまとめてみました。いつも通り独断と偏見まみれなので、他にも良いRは沢山ありますよーという旨予めお断りしておきます。 そうそう、先に書いておきますがこのリストは中級者向けです。でも初学者向けに良いRのってあるのかなぁ。。。初学者はまずはExcel

    Rでデータ分析・統計学・機械学習・データマイニングを学ぶならこの10冊で(2015年2月版) - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas

    統計についてほとんど何も知らない人が読むべきとしては『マンガでわかる統計学』が一番のおすすめである。 『マンガでわかる統計学』 「統計って、今まで全然勉強したことはないけれども、将来必要になるかもしれないから、勉強してみようかな」とか、「統計を勉強してみたいとは思ってるんだけど、何から始めれば良いか見当がつかないんだよね」と思っている人は少なくないと思う。こうした人、すなわち統計学についてほとんど何も知らない人は何を使って勉強し始めれば良いのだろうか。 こうした初心者は、まず入門として『マンガでわかる統計学』というを読むのが良いと私は考えている。このは、統計に関する知識がほとんどない人にとって、わかりやすく、そして取り組みやすいだ。 高橋信. (2004). 『マンガでわかる統計学』 東京:オーム社. この『マンガでわかる統計学』というは、統計について特に何も知らない女子高生のル

    統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas
  • 社会人のためのデータサイエンス入門/総務省統計局データサイエンス・オンライン講座

    統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

    社会人のためのデータサイエンス入門/総務省統計局データサイエンス・オンライン講座
  • 分析ツールと統計学、数学者と統計学者の関係は

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 『統計学が最強の学問である[実践編]』発刊記念対談 35万部を突破したベストセラー『統計学が最強の学問である』の続編、『統計学が最強の学問である[実践編]』の出版を記念し、著者・西内啓氏をホストに統計学をめぐるシリーズ対談の連載がスタートします。 ゲストは前統計学会会長、気鋭の経済学者、統計学者など。普段は知ることのできない統計学者の斬新な視点と意見をお楽しみください。 バックナン

  • 企業における統計学入門

    経済学部1年生対象の統計学の講義で用いた資料です。統計学を学び始めた学生さんに、企業で統計学を用いるとはどういうことかを紹介し、就活や仕事でも役立つと言うことを説明しました。 学生さんの統計学を学ぶモチベーションを高められたら幸いです。

    企業における統計学入門
  • データ・サイエンティスト関連書籍の人気トップ10 <2014年9月1日現在>: 教育機関向けソフトウェア アカデミック・ソフト・プラス Academic Software +Plus

    Amazon.co.jpにおけるデータ・サイエンティスト関連の話題の:トップ10 *2014年9月1日現在。Amazon.co.jpの売れ筋ランキングより抽出 第1位 ビジネス活用事例で学ぶ データサイエンス入門 ビジネス活用事例で学ぶ データサイエンス入門新品価格 ¥2,376から (2014/9/1 12:46時点) 第2位 データサイエンティスト養成読 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] データサイエンティスト養成読 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)新品価格 ¥2,138から (2014/9/1 12:47時点) 第3位 現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~ 現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識

    データ・サイエンティスト関連書籍の人気トップ10 <2014年9月1日現在>: 教育機関向けソフトウェア アカデミック・ソフト・プラス Academic Software +Plus
  • 異端的統計学者としてのナイチンゲール : 人類応援ブログ

    そんな彼女に科学者、しかも「戦闘的」で「異端的」で「革命的」な「統計学者」としての顔があったことを、皆さんはご存知でしょうか。

    異端的統計学者としてのナイチンゲール : 人類応援ブログ
  • TBSテレビ「ベストセラー講義」連動企画 『統計学が最強の学問である』無料版

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 統計学が最強の学問である 2013年1月に発売されるや、ビジネス・経済書としては異例のベストセラーとなり、統計学ブームの端緒となった『統計学が最強の学問である』。同書の発刊1周年と30万部突破を記念して行われた、著者の西内啓氏と二人の科学者[多摩大学情報社会学研究所所長・公文俊平氏、物理学者・楽天株式会社執行役員・北川拓也氏]との対談を公開する。 バックナンバー一覧 記事は、8月

  • 統計学・データサイエンスの勉強法

    ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。 教師用の教科書と初心者用の教科書 私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、そのだけを読めば分かるようになっていると同じ印象を持ちました。 オンライン教育(MOOC) アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富

    統計学・データサイエンスの勉強法
  • 今月下旬に『手を動かしながら学ぶ ビジネスに活かすデータマイニング』(技術評論社)という本を出します - 渋谷駅前で働くデータサイエンティストのブログ

    日、出版元の技術評論社(gihyo)様の公式サイトでオープンになりました。 手を動かしながら学ぶ ビジネスに活かすデータマイニング:書籍案内|技術評論社 そして書影はまだ反映されていないようですが、Amazonでも予約受付が始まった模様です*1。 手を動かしながら学ぶ ビジネスに活かすデータマイニング 作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行(ソフトカバー)この商品を含むブログ (3件) を見る ということで、僕が生まれて初めて執筆した書籍が恥ずかしながら8月22日(予定)に発売されることになりました。詳しくはgihyo様の公式サイトをご覧いただきたいのですが、このブログで唯一はてブ1000超えを達成したエントリ(Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くData Scientistのブ

    今月下旬に『手を動かしながら学ぶ ビジネスに活かすデータマイニング』(技術評論社)という本を出します - 渋谷駅前で働くデータサイエンティストのブログ
  • 「正しく推論する方法」は世界最優秀ケーススタディに学べ:日経ビジネスオンライン

    に巻いた帯では「ケーススタディは経営学の最強スキルである」とうたっています。ベストセラーになった『統計学が最強の学問である』に対抗しているわけですか? 井上:おっしゃる通り「統計学」との対比を意識しています。帯のコピーは編集者が決めたもので、「経営学の最強スキル」というのは大げさじゃないかと感じる人がいるかもしれませんが、ケーススタディ(事例研究)は統計学と同じくらい重要な手法だというのは間違いのないところだと思っています。私たち経営学者にとっても、ビジネスの実務家にとっても、ケーススタディは大変に役に立つ。だから、その方法を学んでほしいと思って、この『ブラックスワンの経営学』を執筆しました。 平均は「過去」、はずれ値こそが「未来」 「ブラックスワン」は「ありえない」ことの象徴だそうですが、それがケーススタディとどう関係するのですか? 井上:経営学の研究には主として2つの方法が使われてい

    「正しく推論する方法」は世界最優秀ケーススタディに学べ:日経ビジネスオンライン
  • 戦略的データサイエンス入門

    ビッグデータ時代とも言われる昨今においては、膨大なデータをビジネスの枠組みの中に組み込んで活用することが重要課題となっています。つまり、データ収集を行ってビジネスの全体像を把握し、適切なデータ分析を行って正確な予測をした上でビジネス戦略を決めることが求められています。書は、データをビジネスに活かすために身に付けておくべき基的な考え方と、データマイニングやモデリングの根底に存在するコンセプトについて、体系的に解説しています。データサイエンスの重要性とその威力を学べる一冊です。 訳者前書き はじめに 1章 はじめに:データ分析思考 1.1 データを使ったビジネスチャンスの広がり 1.2 例:ハリケーン・フランシス 1.3 例:顧客の乗り換えの予測 1.4 データサイエンス、エンジニアリング、そしてデータ主導による意思決定 1.5 データ処理とビッグデータ 1.6 ビッグデータ1.0からビッ

    戦略的データサイエンス入門
  • 今から統計学を学ぶならコレ!間違い無しの超良質記事まとめ10選。 | SIROKグロースハックブログ

    グロースハックを格的にしようとすると、統計学が出来ると凄く便利!今回は、この記事を見ておけば今からでも統計学を使いこなせるようになる記事をピックアップしましたので、ご覧下さい! ハンバーガーショップで学ぶ楽しい統計学 にもなっている統計学の入門には最適な決定版サイト。広く使われている統計手法について分かりやすく解説されています。 オンラインで無料で読める統計書22冊 Web上で閲覧可能な統計書がまとめられている超お得な情報が詰まっている記事。 WEBで読める統計関係の良質な資料 統計に関する良質な資料がまとめられている記事。 統計屋による新社会人のための統計系入門書お薦め一覧 統計について学べる入門書についてまとめられている記事。 統計学を勉強するときに知っておきたい7つのポイント 統計学を学ぶ上で、重要なポイントが整理されている記事。 統計学を勉強するときに知っておきたい

    今から統計学を学ぶならコレ!間違い無しの超良質記事まとめ10選。 | SIROKグロースハックブログ
  • なぜ、統計学が最強の学問なのか?

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 統計学が最強の学問である 2013年1月に発売されるや、ビジネス・経済書としては異例のベストセラーとなり、統計学ブームの端緒となった『統計学が最強の学問である』。同書の発刊1周年と30万部突破を記念して行われた、著者の西内啓氏と二人の科学者[多摩大学情報社会学研究所所長・公文俊平氏、物理学者・楽天株式会社執行役員・北川拓也氏]との対談を公開する。 バックナンバー一覧 35万部を突破

  • 統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!

    稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ること を主眼に選定したお薦め書籍を紹介します。 (満たせない要望も多いですが) 主な対象者は、文系で数学や統計学をやってこなかった、 プログラミングもわからない(Excelで四則演算やマウス操作くらいは使える) けどいつかマーケティングやデータマイニングやってやるぜ! って考えてる新卒の方です。 筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。 ここで紹介している内容で 「統計学・機械学習・データマ

    統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!