タグ

統計学に関するkananoteのブックマーク (15)

  • データサイエンティストを目指すというかデータ分析を生業にするなら読んでおきたい初級者向け5冊&中級者向け12冊(2015年冬版) - 渋谷駅前で働くデータサイエンティストのブログ

    (Photo via VisualHunt) 追記 2017年3月現在の最新書籍リストはこちらです。 最近になってまた色々とデータサイエンティストを目指す人向けのお薦め書籍リストとか資料リストとかが出てきてるんですが、個人的には何かと思うところがあるので僕も適当にまとめておきます。偏りありまくり、完全に主観で決めたリストなので文句が出まくるかと思いますが、もはや毎回のことなのでご容赦を。 なおこちらのリストはあくまでもビジネスの現場でデータ分析を生業にする(しようとしている)人たち向けのものであり、研究者含めたガチ勢の方々向けのものではありませんのでどうか悪しからずご了承下さい。 ちなみに毎回言ってますが、アフィリエイトは全くやっていないのでここに貼られたリンクを踏んで皆さんが購入されても僕の懐には一銭も入りません。拙著だけはそもそも例外ですが(笑)。*1 初級者向け5冊 一応初級者向けと

    データサイエンティストを目指すというかデータ分析を生業にするなら読んでおきたい初級者向け5冊&中級者向け12冊(2015年冬版) - 渋谷駅前で働くデータサイエンティストのブログ
  • プリキュアで学ぶ統計学①---パンプキン王国の回帰分析---【初心者向け】 - プリキュアの数字ブログ

    Go!プリンセスプリキュア 秋の映画 「Go!プリンセスプリキュア Go!Go!!豪華3立て!!!」の初動2日間の数値がでましたね。 2015年10月31日公開、初動2日間で、 動員11万8292人、興行収入1億2938万3300円 でした。 まずは結果から。 これを使っていわゆる回帰分析(の初歩の初歩)をやりたいと思います。 この「初動の興行収入」から「最終の興行収入が予測」できます。 結論的にはこうなります。 プリキュア映画の「初動2日間」と「最終興行収入」には 相関係数=0.988、決定係数R2=0.9895の高い相関が認められ 単回帰式 y=4.0844x+1.0113 y=最終興行収入(億円) x=初動2日間の興行収入(億円) より、 「Go!プリンセスプリキュア Go!Go!豪華3立て」の 最終興行収入は 6.30億円になることが予測される。 、となります。*1 (初心者向

    プリキュアで学ぶ統計学①---パンプキン王国の回帰分析---【初心者向け】 - プリキュアの数字ブログ
  • 統計を勉強するときに数学に悩まされる人のための一冊|Colorless Green Ideas

    統計の勉強を始めるときに数学でつまづくことがある。そういったときに『統計学のための数学教室』というが役に立つ。 統計を勉強しはじめたものの、統計が結局よく理解できなかったという人は少なくない。統計の勉強がうまくいかない理由にはさまざまなものがあるが、1つの大きな理由として、統計の教科書に載っている数式が分からないというものがある。数学についてよく知らないと、統計の教科書の数式に悩まされ、統計をしっかり理解できない。統計の考え方の多くの部分は、数学の言葉で書かれているので、数学が分からなければ、統計を理解することができないのだ。 私が前に統計を教えたときは、まず数学をしっかり勉強してもらうところから始めた。統計の入門書に書いてある数式を読むのに必要な数学の知識を身につけてもらったのである。実際そうすることで、統計についてしっかり理解してもらうことができたと思う。そのときは自作の小冊子をつか

  • 『ダメな統計学』冊子PDFの公開|Colorless Green Ideas

    『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 『ダメな統計学

    『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
  • 統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas

    統計についてほとんど何も知らない人が読むべきとしては『マンガでわかる統計学』が一番のおすすめである。 『マンガでわかる統計学』 「統計って、今まで全然勉強したことはないけれども、将来必要になるかもしれないから、勉強してみようかな」とか、「統計を勉強してみたいとは思ってるんだけど、何から始めれば良いか見当がつかないんだよね」と思っている人は少なくないと思う。こうした人、すなわち統計学についてほとんど何も知らない人は何を使って勉強し始めれば良いのだろうか。 こうした初心者は、まず入門として『マンガでわかる統計学』というを読むのが良いと私は考えている。このは、統計に関する知識がほとんどない人にとって、わかりやすく、そして取り組みやすいだ。 高橋信. (2004). 『マンガでわかる統計学』 東京:オーム社. この『マンガでわかる統計学』というは、統計について特に何も知らない女子高生のル

    統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas
  • 統計学・データサイエンスの勉強法

    ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。 教師用の教科書と初心者用の教科書 私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、そのだけを読めば分かるようになっていると同じ印象を持ちました。 オンライン教育(MOOC) アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富

    統計学・データサイエンスの勉強法
  • 7/21 「勝てる野球の統計学 セイバーメトリクス」トークライブレポート

    当日は99名のお客様が来場し、ご覧の通りほぼ満席となりました。2時間半という長丁場でしたが、皆さん真剣にスクリーンを見ながらトークを聞いていました。ここからは内容について振り返りたいと思います。まずは出演者の紹介です。 データスタジアム株式会社 ベースボール事業部アナリスト 金澤 慧(かなざわ けい) アナリストとして、分析レポートをプロ野球チームに提供。野球データを生かしたエンターテインメントの制作にも数多く携わっており、NHK BS1で放送された「ザ・データマン」には守備を評価する指標「UZR」の解説役として出演。 当日のイベントでは進行役も務めました。

    7/21 「勝てる野球の統計学 セイバーメトリクス」トークライブレポート
  • MOOCで「データサイエンティスト」育成へ--11月から「統計学」開講

    NTTデータ、NTTドコモ、NTTナレッジ・スクウェア、日統計学会は6月9日、大規模公開オンライン講座「MOOC(Massive Open Online Course、ムーク)」のプラットフォーム「gacco(ガッコ)」を活用した、データサイエンティストの育成プロジェクトを開始したと発表した。 gaccoは、ドコモとナレッジ・スクウェアが共同で推進しており、サービスはナレッジ・スクウェアが提供している。今回のプロジェクトでは産官学が連携し、統計学の基礎的な概念からビジネスに役立つ実践的な応用までを学べる機会を提供。社会的ニーズが高まりつつあるデータサイエンティストの育成と輩出を目指す。 ドコモとナレッジ・スクウェアは、統計学講座を11月に開講予定。講座内容は、統計学会が統計検定を通じて体系化している統計教育質保証に沿うものであり、統計学会が推薦する複数の大学教授陣が講師を務めるという。ま

    MOOCで「データサイエンティスト」育成へ--11月から「統計学」開講
  • 2014年春版:ビジネスにおけるデータ分析のプロを目指すなら揃えておくべき12冊 - 渋谷駅前で働くデータサイエンティストのブログ

    さて、前回リストの記事から半年ぐらい経ちましたよーということで、それ以降に発刊された書籍などを吟味した上で更新したリストをお届けしたいと思います。といっても引き続き今回のリストにも入っているものが多いので変わり映えしないかもですが。。。 前回同様、統計学や機械学習にまつわる学術的な知識を得るだけにとどまらず、ビジネスにおけるデータ分析のプロとして知っておきたい知識を得るために必要な書籍もリストに入れてあります。 確率論まわりの基礎理論についての書籍は僕自身が勉強途中なので割愛しました*1。またコーディングまわりのは一旦割愛してあります。というか僕はエンジニアとは言い難い身なので(泣)、コーディングまわりや詳細な実装プロセスなどは適宜必要なを読んで下さいということで。。。 そして改めての断り書きですが、これは「ある程度既に統計学や機械学習などに馴染みがあってそれなりにPythonでコード

    2014年春版:ビジネスにおけるデータ分析のプロを目指すなら揃えておくべき12冊 - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!

    稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ること を主眼に選定したお薦め書籍を紹介します。 (満たせない要望も多いですが) 主な対象者は、文系で数学や統計学をやってこなかった、 プログラミングもわからない(Excelで四則演算やマウス操作くらいは使える) けどいつかマーケティングやデータマイニングやってやるぜ! って考えてる新卒の方です。 筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。 ここで紹介している内容で 「統計学・機械学習・データマ

    統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!
  • Amazon.co.jp: 本: 統計でウソをつく法 ― 数式を使わない統計学入門

    Amazon.co.jp: 本: 統計でウソをつく法 ― 数式を使わない統計学入門
  • 「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ - 六本木で働くデータサイエンティストのブログ

    先日の記事はおかげさまで好評をいただいたんですが、勉強中の身で教科書を確認せずに書いたこともあり多数ツッコミをいただきました。ツッコミをいただけるというのはもちろん大変良い勉強の機会になるということで*1、今回もひとしきり勉強してみました。 ということで、自戒も込めて備忘録的に勉強したことをまとめておこうと思います。今回はあまり広く読んでもらう内容ではないので、不親切かもしれませんがごめんなさい。ただし、あまりにも理論的側面ばかり色々書いても何なので、インターネット広告業界の言葉で喩えて言うなら「クリック数*2をモデリングしたい場合」と「コンバージョン数*3をモデリングしたい場合」とに分けた、と理解してもらえたら良いかなと思ってます。 今回も参考文献は久保です。一般化線形モデルまわりではこのより分かりやすいは依然としてないと思います。 データ解析のための統計モデリング入門――一般化線

    「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ - 六本木で働くデータサイエンティストのブログ
  • Amazonに見る小さなビッグデータ - 小人さんの妄想

    Amazonサイト上で、1冊のランキングを追跡すれば、書店全体の売上傾向がわかる。 そんなことを数理的に詳しく調べた研究があります。 Amazonランキングの謎を解く: 確率的な順位付けが教える売上の構造 (DOJIN選書) 作者: 服部哲弥出版社/メーカー: 化学同人発売日: 2011/05/30メディア: 単行購入: 4人 クリック: 551回この商品を含むブログ (26件) を見る 著者である服部哲弥先生の解説ページはこちら。 この"ランキング"の帰結によると、Amazonは実はロングテールビジネスではない、とのことです。 一方、Wikipedia の「ロングテール」の項目には 「代表的なオンライン小売店の1つである「Amazon.com」(アマゾン社)を例に説明する。」 と記されているくらいですから、これはかなり意外な結果ではないでしょうか。>> wikipedia:ロング

    Amazonに見る小さなビッグデータ - 小人さんの妄想
  • Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!

    こんにちは!今年の春からWeb系企業でHTML/CSSデザイナーとして働きだしたキラキラ女子(を目指してる)のあんちべ(23)です!よろしくお願いします!私は普段自社のWebサービスCSSなどを書いている*1のですが、最近データマイニングに興味を持ち始め、データを分析して、自社サービスの売り上げ改善に貢献したいなーと思うようになりました!でも。。。私は文系出身で統計学とか全然わからない*2し、プログラミングも得意じゃない*3し、高価な統計解析ソフトを買うのも辛いです。。。無い無い尽くしですね><;!そんな私に救いの手が!インストール作業不要で、便利な統計処理機能が色々あって、しかも無料という素晴らしいソフト*4を発見しました!その名も"Incanter"です!なんでも、 Lispっていう古くから使われてきた実績のあるプログラミング言語で動いてて、Lispの文法でどんな処理をすればよいかを

    Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

  • 1