[B! statistics] mk_chapのブックマーク

効果検証入門から見直す「データサイエンス」

All-in-One Bioinformatics Platform Realized with Snowflake ~ From In Silico Drug Discovery, Disease Variant Analysis, to Single-Cell RNA-seq

mk_chap 2020/08/29

statistics

リンク

Pythonで統計学を勉強するメリット統計学を学ぶにあたって、Pythonを利用するメリットを確認しておきましょう。近年の統計業務は、Pythonを使ったアプリケーションで行うケースが増えており、Web上のノウハウや書籍が充実しています。これらを活用することで、統計学の知識が乏しい状態でも、Pythonを切り口として学習を進めやすくなっています。煩雑な計算を省略できる Pythonは科学計算処理に必要なライブラリが充実しています。Pythonのライブラリには、統計で用いられる専門的な計算式が内包されており、基礎的な考え方さえ理解していれば、具体的な計算式を知らずとも実践的な統計を実行可能です。もちろん読書や座学でも学習は可能ですが、Pythonを利用することで「煩雑な計算の理解」に時間を取られずにすむため「統計を使ってできること」をダイレクトに理解し易くなるでしょう。データが簡単に

mk_chap 2016/07/15

statistics

リンク

ベイズ統計の入門書が出版ラッシュなのでまとめてみた - ほくそ笑む

【宣伝】2016/09/14 このページに来た方へ。あなたが求めている本はこれです。 StanとRでベイズ統計モデリング (Wonderful R) 作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行本この商品を含むブログ (10件) を見るまずこれを予約してから下記を読むといいです。【宣伝終】最近、ベイズ統計の入門書がたくさん出版されているので、ここで一旦まとめてみようと思います。 1. 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 (2015/6/25) 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2015/06/25メディア: 単行本この商品を含むブログ (6件) を見るデータ分析業界ではかなり有名な豊田秀樹先生の本です

mk_chap 2015/12/28

statistics

リンク

「統計学と機械学習の違い」はどう論じたら良いのか - 渋谷駅前で働くデータサイエンティストのブログ

何かこんなメディア記事が出ていたようです。これを読んで色々な人がツッコミを入れまくっている模様ですが、この記事の不思議なところは「完全に間違った説明というわけでもないのに何故か（両分野に詳しい）誰が読んでも猛烈な違和感を覚える」ところなんじゃないかなぁと。正直、これはライター・インタビュアー・コメンテーター・編集者の誰のせいなのかは全く分からないんですが、ツッコミ入れられまくっている内容について色々あげつらってもあまり建設的でないので、ここでは記事中で本題として取り上げられている「統計学と機械学習の違い」についてちょっとコメントしてみようと思います。あ、もちろん僕がこれから書くコメントも別に正しいとは全く限らないので、おかしいところや間違ってるところがあったらバンバン突っ込んでいただければ幸いです*1。そしてガチ勢向けのコメントでもないので何卒悪しからず。統計学はデータを「説明」す

mk_chap 2015/09/17

statistics

リンク

「統計数理」既刊目次

各論文の全文pdfをご覧いただけます。 pdfを公開しているものについては、著作権は統計数理研究所に帰属します第72巻第１号第２号 (2024年) 第71巻第１号，第２号 (2023年) 第70巻第１号，第２号 (2022年) 第69巻第１号，第２号 (2021年) 第68巻第１号，第２号 (2020年) 第67巻第１号，第２号 (2019年) 第66巻第１号，第２号 (2018年) 第65巻第１号，第２号 (2017年) 第64巻第１号，第２号 (2016年) 第63巻第１号，第２号 (2015年) 第62巻第１号，第２号 (2014年) 第61巻第１号，第２号 (2013年) 第60巻第１号，第２号 (2012年) 第59巻第１号，第２号 (2011年) 第58巻第１号，第２号 (2010年) 第57巻第１号，第２号 (

mk_chap 2015/03/15

statistics

リンク

社会人のためのデータサイエンス入門／総務省統計局データサイエンス・オンライン講座

第１週：統計データを用いた分析事例を知り、統計リテラシーを学ぶ・大人がデータサイエンスを学ぶべき理由・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性・統計を利用する際の注意点第２週：データ分析に必要な統計学の基礎を学ぶ・データの種類・代表値～平均・中央・最頻値・ヒストグラムと相対度数・四分位・パーセンタイル・箱ひげ図・分散・標準偏差・相関関係・回帰分析・標本分布・信頼区間第３週：データの見方と適切なグラフの選び方を学ぶ・統計表の見方・比率の見方①－クロスセクションデータ－・比率の見方②－使い方と注意点－・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点第４週：誰もが使える公的統計データの取得方法と使い方を学ぶ・公

mk_chap 2014/12/20

statistics

リンク

企業における統計学入門

経済学部1年生対象の統計学の講義で用いた資料です。統計学を学び始めた学生さんに、企業で統計学を用いるとはどういうことかを紹介し、就活や仕事でも役立つと言うことを説明しました。学生さんの統計学を学ぶモチベーションを高められたら幸いです。Read less

mk_chap 2014/11/17

Statistics

リンク

統計学・データサイエンスの勉強法

ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。教師用の教科書と初心者用の教科書私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日本語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日本はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、その本だけを読めば分かるようになっていると同じ印象を持ちました。オンライン教育（MOOC）アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富

mk_chap 2014/08/23

statistics

リンク

社会人なら知っておきたい無料の公的統計データ「e-Stat」と「統計メールニュース」 | 初代編集長ブログ―安田英久

今日は、マーケティングや企画に携わる社会人なら知っておきたい、というよりは、知らないと恥ずかしい、無料で利用できる公的統計データのポータルサイト「e-Stat」の情報と、新しい統計データが自動的に飛んでくる「統計メールニュース」の情報をお届けします。すでに6月も下旬。新入社員の方も配属部署が決まってバリバリ働いていることだと思います。マーケティングや企画の仕事をする人にとって、調査データというのは大切なもの。ネット上で発表される「○○のサービスのユーザー数が○○万人」なんて調査データ、みんな好きですよね。Googleトレンドのような検索ボリュームの情報や、どのブラウザがどれぐらい使われているかといった調査データも人気です。どれも無料で入手できるデータですが、実は税金でちゃんとした手法でつくられている、質の高い調査データというのが、あるのです。それが、政府の出している統計データ。

mk_chap 2014/06/24

statistics

リンク

統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ！

本稿では統計学・データマイニング・機械学習関連書籍について内容が易しいこと。数学力（特に微積・線形代数）を求められないこと入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと実務に繋げやすいこと。持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ることを主眼に選定したお薦め書籍を紹介します。（満たせない要望も多いですが）主な対象者は、文系で数学や統計学をやってこなかった、プログラミングもわからない（Excelで四則演算やマウス操作くらいは使える）けどいつかマーケティングやデータマイニングやってやるぜ！って考えてる新卒の方です。筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。ここで紹介している内容で「統計学・機械学習・データマ

mk_chap 2014/04/01

statistics

リンク

統計解析 & R言語超初心者入門資料まとめ

興味を持ち続けていた統計解析や、R言語の勉強をはじめました！　まだまだ初歩の初歩ですが、この記事がいつか偉大な一歩になれるように頑張っていく所存ですw まずは、R言語や統計解析に関する入門記事や、モチベーションがアップしそうな記事をまとめていきます！ (02/23 11:00) 初学者の人にお勧めな資料にフォーカスしてまとめ直し 🍮 [スライド] 統計学入門統計学の全体像をつかむのに最適なスライドです。初歩…とはちょっと呼べないくらい内容が深いです！ 🏈 [スライド] 初めての「R」統計解析を始めるときにWindowsな方も、Macな方もとっつきやすのが『R』です。このRを完全初心者をターゲットに説明をしていただけている資料です。超わかりやすいです！ 🍄 [デスクトップアプリケーション] R用のIDE: RStudioRStudio RStudioはR言語用のIDEです。Wind

mk_chap 2014/02/17

statistics

リンク

統計・データ解析

『Rで楽しむ統計』が出ました。サポートページ『Rで楽しむベイズ統計入門』が出ました。サポートページ，第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE（教育用標準データセット）も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが，本サイトの古い記事ではそうなっていないところがあるかもしれません（read.csv() などで as.is=TRUE は不要になります（あってもかまいませんが））。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8"，"UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS（CP932）データの場

mk_chap 2013/12/30

statistics

リンク

伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ - EchizenBlog-Zwei

「図解・ベイズ統計「超」入門あいまいなデータから未来を予測する技術」という本を読んだ。社会人のアヤとケンが社内研修で伝説のベイジアン先生からベイズの基礎を教わる、という設定の会話形式でベイズについて書かれた入門書。社内研修でベイズのプロから指導を受けるとかどんだけ恵まれてるんだ。アヤさんは大学で統計をやったが数学は詳しくないという設定。ただ時々鋭い質問をする。また統計に詳しいイケメン兄がいる。ケンくんは知識は全くなく最後まで「わかりません」を連発する。彼女持ちのリア充。伝説のベイジアン先生は社内研修の講師。ベイズの基礎を豊富な具体例で教えてくれるまじぱない先生。あまりにもいけてるので数カ月後に転職しそうな感じ。内容は1章が導入、2章が同時確率・条件付き確率、3章がベイズの定理、4章がベイズの定理を用いた事後確率計算の具体例、5章が事例の追加による事前確率の更新(具体例としてナイ

mk_chap 2013/12/28

リンク

面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ！

転職して丁度2年がたちました。現在はWebベンチャーで統計屋しています。大変楽しい毎日です。なぜ楽しいかというと勿論リスプを書いているからというのも大きなる理由の一つです*1。このエントリでは何が楽しいのか近況交えてつらつらまとまりなく書いてます。あと現職の解決しがたい不満についても書いています。糞長くなってしまったので要約すると「今糞面白いけど超えられない壁あるので誰か助けて」です。現職面白い理由5個。 1．データが面白い*2 私は経済学科・数理統計の研究室出身で、応用先としてコミュニケーション活性化を目的とした行動経済学やテキストマイニングをやっていました。そういう背景があるため、学生時代いつか壮大な社会実験をやりたいと思ってたけど、それには大変なお金がかかったり大がかりなシステムを構築しないといけなかったりで断念した。ですが今はSNSやソーシャルゲームや広告の

mk_chap 2013/12/05

statistics

リンク

データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは

知人に、確率・統計を勉強するにはどんなん読んだら良いんかね？と聞かれたので、まとめる。線形代数統計を勉強しようと思ったら、先ず、線形代数を勉強するのが良いと思う。回帰分析とか主成分分析とか多次元尺度構成法とか、こういう有名ドコロが一発で分かる。線形代数を知らずに統計の本で「コレコレの計算で出てきた値が第一主成分だよ」みたいな説明を何回くり返し読んでも、多分、一生理解出来無いと思う。対称行列は直交行列で対角化出来るよね、とか、これは射影行列の形だね、とかが自然に分かるようになってから、統計の本を読むとよく理解出来る。で、線形代数のお奨めはこれ。プログラミングのための線形代数作者: 平岡和幸,堀玄出版社/メーカー: オーム社発売日: 2004/10/01メディア: 単行本購入: 27人クリック: 278回この商品を含むブログ (90件) を見るプログラミングのための…とあるんだけど

mk_chap 2013/09/15

statistics

リンク

さらば！データサイエンティスト

2. 自己紹介  比戸将平（HIDO Shohei）  TwitterID: @sla  専門：データマイニング、機械学習  経歴：  2006-2012: IBM東京基礎研究所データ解析グループ  機械学習(特に異常検知)のアルゴリズム研究開発  お客様案件でデータ解析プロジェクトに従事  2012-: 株式会社プリファードインフラストラクチャー  大規模オンライン分散機械学習基盤Jubatusチームリーダー  2013-: Preferred Infrastructure America, Inc.  Chief Research Officer 2

mk_chap 2013/08/24

statistics

リンク

単純な集計とデータサイエンスによる分析とで結果が食い違うかもしれない3ケース - 渋谷駅前で働くデータサイエンティストのブログ

一般に、データ分析の大半はそれほど高度なテクニックの類を必要としないものです。僕も常日頃から口に出して言うことが多いんですが、「統計学だの機械学習だのの出番なんてそもそも少なくて当たり前」。工数もかかるし、できればやらない方が良いです。ぶっちゃけ単純な四則演算で十分なケースの方が多数派でしょう。なので、普段はDB上でSQL（というかHiveなど）でサクッと四則演算だけで集計処理を済ませてしまって、その結果だけを表示するようにしておいた方が圧倒的に楽で手っ取り早いはず。多くのBIツールもそういう考えのもとで作られていると思います。ところがどっこい。世の中には、単純な四則演算での集計結果と、データサイエンスを駆使した分析結果とで、食い違ってしまうケースが何故かあることが知られています。どちらかと言うとレアケースだとは思いますが、その矛盾をおざなりにするととんでもないことになることも多々あり

mk_chap 2013/08/07

statistics

リンク

Rで計量時系列分析：VARモデルから個々の時系列データ間の因果関係を推定する - 渋谷駅前で働くデータサイエンティストのブログ

前回の記事ではVARモデルの基礎までを取り上げました。ということで、今回はVARモデルに基づいて異なる時系列同士の因果関係を推定する3つの手法について取り上げてみようと思います。ということで毎回毎回しつこいですが、使用テキストはいつもの沖本本です。経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者:竜義, 沖本朝倉書店Amazon 以下タイトルにのっとってRで各モデルの挙動を見ながらやっていきます。必要なRパッケージ＆サンプルデータ {vars}をインストールして展開して下さい。なお、Granger因果のグラフ構造表現及び偏Granger因果は、実はそもそもRでは実装されていません。ここだけMatlabの話題になりますので、悪しからずご了承を。。。それから今回のサンプルデータですが、また{vars}同梱のCanadaでは芸がないので違うデータを使うことにします。沖

mk_chap 2013/08/01

statistics
R

リンク

非エンジニアにもオススメ。数学が苦手な統計初心者がR言語を触ってみる。

こんにちは。海原です。ここ最近、統計学が流行していますね。「統計学が最強の学問である」がきっかけになっているのでしょうか。数年前に比べてマーケティングが重要視される今日、統計の需要が増えたのかもしれません。私はまだこの本を読んでいませんが、読もうと思った矢先にたまたま統計ツールRに出会いまして、調べながら少しいじってみました。Rを使った感触から申し上げますと、SQLを叩いて好きなデータをピックアップするよりもずっと簡単で小気味良いのです。他の統計ツールには色々な種類があるようですが、よく知られるものとしてIBMのSPSS (IBM)（有償）があります。その点、RはMac/Win両方に対応しており無償です。またSPSSに劣らない機能を備えており、統計学者の間でデファクトスタンダードとなっているようです。 Rに関して検索すれば丁寧な解説サイトがたくさんありますので、インストールから何の心

mk_chap 2013/07/21

statistics

リンク

統計の基本事項

トップページ→研究分野と周辺→システムの評価→ 基本統計量平均（算術平均）値は、（データ値の総和）÷（データ数）となる。（或るデータの値）－（平均値）を、そのデータの偏差という。偏差の絶対値の大きいデータが多ければ、そのデータ群はばらつきが大きい。データ群のばらつきの大きさを単純に偏差の総和とすると、偏差には正負があるので相殺されてしまう。そこで、各データの偏差を二乗する（こうすれば必ず正の値になる）。（各データの偏差の二乗の総和）÷（データ数）をそのデータ群の分散と呼び、ばらつきの大きさを表す。また、分散の平方根を標準偏差という。英語では偏差はDeviation、分散はVariance、標準偏差はStandard Deviationとなるので、標準偏差はS.D.と略記される事も多い。統計の最も基本的な量である基本統計量としては、他に最大値、最小値、範囲（最大値－最小値）、中央値（デ

mk_chap 2013/06/24

statistics

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

statisticsに関するmk_chapのブックマーク (38)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス