タグ

統計に関するh1saoのブックマーク (152)

  • 初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌

    Photo by Hermann Kaser こんにちは。谷口がお送りします。 ITエンジニアの方の中には「R言語を学習したい」という方も多くいらっしゃるかと思います。 R言語は、データ分析やデータ処理に特化したオープンソースのプログラミング言語です。システムを開発をする他のプログラムミング言語とは位置付けが異なり、統計解析機能が付いていて、解析処理やその結果をグラフィカルに表示することができます。 そのため、多量のデータ解析が求められるソーシャルゲームの解析や、リサーチ、データマイニング、アソシエーション分析が必要な業務の求人が増えています。 また近年データサイエンティストが注目されていることもあり、今後求人が増えることが予想されます。 そこで今回は、プログラミング未経験~初心者の方が、なるべくコストをかけずにR言語に触れられて、学習に役立てられるコンテンツを10件ご紹介していきます。

    初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌
  • 実践 統計モデリング入門 【1. 概要・目次】 - ほくそ笑む

    【宣伝】2016/09/14 このページに来た方へ。あなたが求めているはこれです。 StanとRでベイズ統計モデリング (Wonderful R) 作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行この商品を含むブログ (10件) を見るまずこれを予約してから下記を読むといいです。 【宣伝終】 はじめに 統計モデリングは今後ますます重要になってくる技術です。 現在、Web 上には統計モデリングに関する様々な優良記事があります。 それらの記事は、完成したモデルをスマートに提示しているものが多いようです。 しかし、実際の統計モデリングの現場は決してスマートなものではなく、様々な泥臭い試行錯誤を行いながら地道にモデルを構築していきます。 この一連の記事では、最終的なモデルの完成形をいきなり提示するのではなく、モデル構築の手順をスッテプバイス

    実践 統計モデリング入門 【1. 概要・目次】 - ほくそ笑む
  • http://necochan.com/2014/06/14/python-for-economist-7/

    http://necochan.com/2014/06/14/python-for-economist-7/
  • ESTRELA連載記事「Rとウェブの融合」

    2014年7月号より、公益財団法人統計情報研究開発センターが発行する統計と情報の専門誌「エストレーラ」で、「Rとウェブの融合」と題して記事を連載しています。ウェブ上での記事公開の許可を頂いたのでここに公開します。なおウェブ公開記事は校正前の原稿なので誌上記事とは文章表現等が多少異なりますが、内容には変わりはありません。 Rとウェブの融合(1)ーrChartsの基礎ー (2014年7月号) Rとウェブの融合(2)ーrChartsの利用例ー (2014年8月号) Rとウェブの融合(3)ーrChartsの応用例ー (2014年9月号) 大規模データの高速処理 ーdata.table、dplyrー (2014年10月号) Rとウェブの融合(4)ーrmarkdownー (2014年11月号) Rとウェブの融合(5)ーslidify、R Presentationー (2014年12月号) Rとウェブの

  • ベイズ推定の概要 超入門

    自殺の時空間疫学 http://ikiru.ncnp.go.jp/ikiru-hp/genjo/toukei/index.html 少研究数のメタ分析 Noma, H. Statist. Med. 2011, 30 3304–3312 K=10以下での信頼区間を向上させる Topics はじめに 推測統計の基 最尤推定とベイズ推定 MCMCによるベイズ推定

    ベイズ推定の概要 超入門
  • マイナーだけど最強の統計的検定 Brunner-Munzel 検定 - ほくそ笑む

    対応のない 2 群間の量的検定手法として、最も有名なのは Student の t 検定でしょうか。 以前、Student の t 検定についての記事を書きました。 小標問題と t検定 - ほくそ笑む しかし、Student の t 検定は、等分散性を仮定しているため、不等分散の状況にも対応できるように、Welch の t 検定を使うのがセオリーとなっています。 ただし、これら 2つの検定は分布の正規性を仮定しているため、正規性が仮定できない状況では、Mann-Whitney の U検定というものが広く使われています。 Mann-Whitney の U検定は、正規性を仮定しないノンパラメトリック検定として有名ですが、不等分散の状況でうまく検定できないという問題があることはあまり知られていません。 今日は、これらの問題をすべて解決した、正規性も等分散性も仮定しない最強の検定、Brunner-

    マイナーだけど最強の統計的検定 Brunner-Munzel 検定 - ほくそ笑む
  • 当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 - ハウテレビジョンブログ

    どうも。 1月に入社したばかりの、データ分析担当のn_maoです。 と言いながら、最近はHTMLとjsばかりいじっております。 それはそれで楽しいです。 さて今回はデータ分析のざっくりとした仕事内容と、その分析にかかる手間を省くツールをご紹介します。 データ分析仕事 まずは私の行っているデータ分析という仕事の内容をご紹介します。 私の主な仕事は大きく分けて4つです。 売上げ、会員登録数などの簡単な集計&自動レポーティング データベースからの知識発見(いわゆるデータ分析) 分析結果をもとにした企画立案 実施された企画の効果検証 あくまで私個人の仕事内容であり、データ分析者全員に当てはまるわけではありません。 アルゴリズムの研究開発の方や、インフラ寄りの方もいらっしゃるでしょう。 ですが、同じ職種の方で業務範囲が被っている方も少なからずいらっしゃると思います。 これら4つの業務の中で一番時間

    当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 - ハウテレビジョンブログ
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • 統計局の公式アプリ『アプリDe統計』がちょっとデータがほしい時にかなり便利そう - Play Forward

    ビジネスパーソンが資料作りなどで客観性を高くするために必要になってくる統計情報ですが、なかなかデータを探すのは面倒なもの。そこで統計局がお手軽に統計情報が分かるアプリをリリースしたので少し使ってみたのですが、これがちょっとしたデータがほしい時にかなり便利な優良アプリでした。 ◆ちょっとデータがほしい時にかなり便利な『アプリDe統計』 統計局の公認アプリというだけあって、統計局ホームページで探さなければゲットできないような統計情報がカンタンに分かります。 アプリを起動すると、地域ごとの統計情報、または日にまつわる各種統計情報の2つを選択します。 ◆エリア別に統計情報がゲットできる 地域ごとの情報では、都道府県別にそれぞれ統計情報を入手できます。スマホアプリなのでGPS機能で現在地の市区町村データも分かるのが便利なところです。 例えば、目黒区だとこんな統計情報になっているようです。企業活動数

    統計局の公式アプリ『アプリDe統計』がちょっとデータがほしい時にかなり便利そう - Play Forward
  • データの扱い方・読み方がわかる! 実践的なビジネスデータ分析の入門書『楽しいR』著者インタビュー

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    データの扱い方・読み方がわかる! 実践的なビジネスデータ分析の入門書『楽しいR』著者インタビュー
  • 裏 RjpWiki

    算額(その2008) (23) 兵庫県姫路市広畑区西蒲田 天満神社 明治21年(1888) 近畿数学史学会:近畿の算額「数学の絵馬を訪ねて」,平成4年5月16日 初版第一刷,大阪教育図書株式会社,大阪市. キーワード:円4個,外円 外円の中に等円 3 個を容れる。外円の直径が 13 寸のとき,等円の直径および(図に示す)矢の長さはいかほどか。 外円の半径と中心座標を R, (0, 0) 等円の半径と中心座標を r, (0, R - r), (r, y) とおき,以下の連立方程式を解く。 include("julia-source.txt"); using SymPy @syms R::positive, r::positive, y::negative; eq1 = r^2 + (R - r - y)^2 - 4r^2 eq2 = r^2 + y^2 - (R - r)^2 res = s

    裏 RjpWiki
  • GoogleとFacebookではRをどうやって使っているのか?

    ひさしぶりに統計ソフトRの話。 来年こそは仕事でバリバリつかってみようと思っている統計ソフトのR。 前のエントリーでも書いているように、フリーソフトなのに高機能。(統計解析・グラフの種類が豊富) しかし、日語での資料がまだ少ないのがちょっとイタイ…。 (最近は書籍でも多く診られるようになってきましたけどね!嬉しい限りです) ちょうど調べ物をしてたときに、「How Google and Facebook are using R」というエントリーを見つけました。 今日はその内容をちょっと日語に訳した内容を紹介しようと思います。 紹介するサイトこの記事が書かれていたのは、Dataspora Blog というサイトで、データに関する(Big Data, open source analytics, and data visualization)記事をメインに書かれているようです。 (私は知らな

  • クリスマス暇過ぎて腐女子人気作品の探索的データ解析を行うしかなかった - あんちべ!

    はじめに クリスマスはいつものように全く予定無かったあんちべです、こんばんは! 皆様はクリスマスをお楽しみになられましたでしょうか? 「今yesと答えた奴ら全員地獄に堕ちろ」ってサンタさんにお願いしておいたからな。 さて、世間のリア充様がクリスマスで浮かれまくりやがっていらっしゃる中、 やること無さ過ぎていつものようにpixiv腐女子向け作品を眺めていたところ、 ありがたいことに寂しさを感じる暇もない勢いでどんどん作品が投稿されていました。 ハッピーですね! …………? クリスマスの真っ只中に腐女子絵を投稿している…だと!? クリスマスと言えば皆さんお楽しみのはずでは? いや、クリスマスの夜にむしろ投稿数が増加しているような気が…? という疑惑を抱いたので、実際データを色々眺めてみましょう。 データの説明 データはpixivから下記タイトルで検索した結果を12/26の午前中時点で 各々1

    クリスマス暇過ぎて腐女子人気作品の探索的データ解析を行うしかなかった - あんちべ!
  • 文系がゼロから統計を勉強するときに最初の1年で読むべき本 - StatsBeginner: 初学者の統計学習ノート

    最初の1年で読むべきを考える 私の統計学の理解はまだまだ初歩レベルに留まっていますが、昨日飲んでる時に「初心者向けの統計のってどういうのが分かりやすいですか」というようなことを訊かれて、「俺に訊かれてもあまり参考には……」とか思う一方、まだ初歩レベルの位置にいる人間だからこそ言える「このが分かりやすかったよ論」ってのもあるよなと思ったので、現時点での読書感想みたいなものをメモしておきます。一昨年、統計の勉強を始めた頃の自分にむかって書いてる感じです。 理系の人とか、ある程度統計の理解ができている人からみれば、「質的な理解のためにはもっと難しいがいいよ」ってなるかも知れませんが、「いやそんな難しいの勧められても独学のモチベーションが続かねーよ」っていう立場でまとめておきますw ここでは、 統計の勉強はしたことがなく、標準偏差とか言われても意味分からない プログラミングも全くわからな

    文系がゼロから統計を勉強するときに最初の1年で読むべき本 - StatsBeginner: 初学者の統計学習ノート
  • 統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas

    統計についてほとんど何も知らない人が読むべきとしては『マンガでわかる統計学』が一番のおすすめである。 『マンガでわかる統計学』 「統計って、今まで全然勉強したことはないけれども、将来必要になるかもしれないから、勉強してみようかな」とか、「統計を勉強してみたいとは思ってるんだけど、何から始めれば良いか見当がつかないんだよね」と思っている人は少なくないと思う。こうした人、すなわち統計学についてほとんど何も知らない人は何を使って勉強し始めれば良いのだろうか。 こうした初心者は、まず入門として『マンガでわかる統計学』というを読むのが良いと私は考えている。このは、統計に関する知識がほとんどない人にとって、わかりやすく、そして取り組みやすいだ。 高橋信. (2004). 『マンガでわかる統計学』 東京:オーム社. この『マンガでわかる統計学』というは、統計について特に何も知らない女子高生のル

    統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas
  • knitr ではじめるデータ分析レポート作成 - Qiita

    knitr とは,R のパッケージのひとつでデータ分析のレポート作成に役立ちます. markdown 記法の中で R の処理を記述して,実行結果を HTML などに埋め込んだ状態で生成することができます. またこれらの記事では,R 自体の解説は行いません. あくまで,R を使っている,あるいはこれから使いはじめる人が knitr を使うことでより楽にレポートを作成できるような知識や技術の習得を目指します. 5分ではじめる knitr RStudio を使って knitr の使い方を体験 knitr ではじめるデータ分析レポート作成 ~基礎編~ ゴール:knitr を基的に使えるような知識を身に付けて,R での分析結果を HTML として生成できるようになる knitr ではじめるデータ分析レポート作成 ~応用編~ (作成中) ゴール:knitr のおおよその機能を理解して使いこなせる 関

    knitr ではじめるデータ分析レポート作成 - Qiita
  • 横浜市のオープンデータで人口ピラミッドを作ってみた - え、そこから?

    2014-08-31 横浜市のオープンデータで人口ピラミッドを作ってみた R できそうなことをやってみよう。 Rの勉強をするにあたり、このを注文しました。手を動かしながら学ぶ ビジネスに活かすデータマイニング作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行(ソフトカバー)この商品を含むブログ (1件) を見る  が、まだ来てません。 しかしながら、今日は今流行のデータサイエンティストたる夫が在宅している休日であります。そこで何かデータを触るべく、オープンデータを探していたら、横浜市の「よこはまオープンデータカタログ」というサイトに出会いました。 横浜市政策局 政策課 オープンデータの推進 よこはまオープンデータカタログ(試行版) 集計済みデータのため、簡単にできることは限られていそうでしたが、「人口データがあるなら人口ピラミッドできるじ

    横浜市のオープンデータで人口ピラミッドを作ってみた - え、そこから?
  • ダメな統計学:目次|Colorless Green Ideas

    2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』に大幅に加筆したものだ。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 ここに公開する『ダメな統計学』は、アレックス・ラインハート (Alex Reinhart) 氏が書いたStatistics Done Wrongの全訳である。この文章は全部で13章から構成されている。詳しくは以下の目次を参照されたい。 はじめに データ分析入門 検定力と検定力の足りない統計 擬似反復:データを賢く選べ p値と基準率の誤り 有意であるかないかの違いが有意差でない場合 停止規則と

    ダメな統計学:目次|Colorless Green Ideas
  • 統計検定2級合格作戦 | 過去問などから効率よく合格できるのか?

    Skip to content 統計検定2級合格作戦まとめ② 統計検定2級の公式問題集で横断 […] 共有:共有GoogleTwitterFacebookメールアドレスTumblr 統計検定2級合格作戦まとめ 統計検定2級の公式問題集で横断的 […] 共有:共有GoogleTwitterFacebookメールアドレスTumblr 今回の統計検定2級では、なんと ポアソン分布が出題されました […] 共有:共有GoogleTwitterFacebookメールアドレスTumblr 統計検定2級のなかで、 カイ二乗検定があります。 カイ二乗検 […] 共有:共有GoogleTwitterFacebookメールアドレスTumblr 統計検定2級のなかで、 T分布と標準正規分布があります。 そ […] 共有:共有GoogleTwitterFacebookメールアドレスTumblr 統計検定2級に何回

    統計検定2級合格作戦 | 過去問などから効率よく合格できるのか?
  • 文系人間がゼロから統計検定2級を取るための最短ルート : けっこんしきごっこ。

    2014年03月28日 文系人間がゼロから統計検定2級を取るための最短ルート もはや更新が月イチ以下になってる当ブログですが、 どうやら統計検定の受験記にアクセス数が集中してるようです。 (記事:統計検定2級&統計調査士を受験しました) 他の記事へのアクセスなんて、ほぼゼロなのは秘密です。 そんな私ですが、統計の勉強を始めたのは1年半前です。 大学の専攻は心理学。いわゆる「文系」の人間でした。 専門課程で必要に駆られて勉強を始めてから、 だいたい1年で統計検定2級のラインまで到達しています。 2級を取れば、MARCHレベルの大学でも優秀な方に入るはずです。 「大学で統計を勉強した!」と、とりあえずドヤ顔できるくらいだと思います。 あと、どうやらブログのアクセス数的に、ネットの世界でもドヤ顔できるらしいです。 今回は、「文系だけど・・・」「統計って?」というレベルからスタートして、 「簡単な

    文系人間がゼロから統計検定2級を取るための最短ルート : けっこんしきごっこ。