タグ

統計に関するkittysburgerのブックマーク (134)

  • R言語の自作関数の作り方・使い方 | AVILEN AI Trend

    今回は自作関数の作り方・使い方について解説していきます。他のプログラミング言語を勉強したことがある人ならお分かりかと思いますが、自作関数とは非常に便利なものです。R言語でもこの関数というものが自分で定義することが出来ます。 今まで、回帰分析の関数”lm()”など、既存の関数を使ってきました。これらはR言語側が既に用意してくれていた関数です。そして、この関数というものは自分で定義することで自作することもできるのです。普段からよく行う操作があるのであれば、その関数を自分で関数を作って、一度Rに読み込ませれば、それからは自由に作った自作関数を使うことができるのです。

    R言語の自作関数の作り方・使い方 | AVILEN AI Trend
  • Rに関わりそうなチートシートまとめ(随時更新) - バイアスと戯れる

    チートシートやリファレンスのまとめ Rの基的な操作に関するあれこれ チートシートやリファレンス R Cheat Sheet (PDF) (ADD: 2017.03.11) R Reference Card (PDF) R Reference Card 2.0 (PDF) The Ultimate R Cheat Sheet – Data Management (Version 4) (PDF) R Cheatsheet (PDF) R Reference Card for Data Mining (PDF) 11 Steps for Data Exploration in R (with codes) (ADD: 2017.03.11) Regular Expressions with The R Language 統計ソフトRの「困った」を解決する12(+α)の方法 Rのチートシート

    Rに関わりそうなチートシートまとめ(随時更新) - バイアスと戯れる
  • dplyrのベクトル要素変換用関数3種

    if_else関数 ドキュメントによるとこの関数は、R標準の制御関数の一つであるifelse()と比べてより厳密 strict なものであるらしい。ここでの strict とはどういうことか。yutannihilation さんがこんな記事を書いてくれたのでこちらを読んでほしい。 ifelse()は危険なのでやめてdplyr::if_else()を使いましょう 真偽値の判定を実行するコード(xはyよりも大きい、xのクラスはzである、とか)と、真偽それぞれの状況の応答を引数に与えて実行する。またこの関数は、それだけでなくxの値が欠損値である場合についても特定の処理を実行するという特徴をもつ。欠損値に対する挙動は引数missingによって与える。 x <- c(-3:3, NA) if_else(x < 0, "negative", "positive", missing = "missing

    dplyrのベクトル要素変換用関数3種
  • 列の変換 - mutate関数

    例 試しに、irisデータのSepal.Lengthの値を2倍した変数としてkosakiという変数を作成してみます: library(dplyr) mutate(iris, kosaki = Sepal.Length * 2) このように、引数の...で受け取った内容を評価し、.dataで指定したデータセットの最後に追加します。また、変数名として既存の名前を与えると、その変数が上書きされます: mutate(iris, Sepal.Length = Sepal.Width * 3)

  • 施策の効果をどうやって測るか(2) - 検出力と効果量 - About connecting the dots.

    前回で仮説検定のお話をしましたが,その中で「有意水準」というものがでてきました.今回は,その有意水準を正しく検出できる力(=検出力)と,検出された効果の実質的な意味(=効果量)についてみていきます. 有意水準とは 前回でも触れましたが,有意水準(significance level)は,それより確率が低い事象が起きたときには「その事象は偶然ではない」と判断するための基準値です.分野によって違いますが,だいたいの行動科学では,通常は5%が,効果が検出しづらい研究対象/分野では10%が有意水準として使われる場合が多いです.なので,5%とか10%とかに実質的な意味はありません.単なる慣習です. サンプルサイズと検出力 検定を行う対象となる統計量は,基的にはサンプルサイズが増えれば増えるほど大きな値を取る傾向があります.たとえば下の例は,スチューデントのt統計量ですが,式をみればわかる通り,サン

  • Introduction to dplyr(和訳) - Qiita

    この記事はRのdplyrパッケージの「Introduction to dplyr」というVignetteを訳したものです。原文はMITライセンスで公開されているパッケージに含まれ、著作権はRStudio社に帰属します。 あまり英語力に自信がないので、誤訳などあればご指摘ください。編集リクエスツ・アー・ウェルカム!(@uriさんありがとう!) データを扱うときは必ず以下のようなステップを踏みます。 自分がこれから何をしたいのか理解する それをコンピュータープログラムという形で記述する そのプログラムを実行する dplyrパッケージを使えば、このステップをすばやく簡単に行えるようになります。具体的には、 選択肢を制限することで、よくあるデータ操作をシンプルに考えられるようにします シンプルな「verb1」、つまり、よくあるデータ操作に対応する関数を提供します 効率的なデータストレージをバックエ

    Introduction to dplyr(和訳) - Qiita
  • Rでメタアナリシス - 驚異のアニヲタ社会復帰の予備

    メタアナリシスの講義を受けたのでrmetaを使ってメタアナリシスがどんなんかをひたすらプロットしていく。 install.packages("rmeta") library(rmeta) data(catheter) このデータは銀加工かなんかをされたカテーテルの細菌感染具合を調べたものらしい。 加工カテーテルと標準カテーテルを比較して、コロニー形成と、血流内まで細菌が到達してしまったものを検討したいらしい。 Name: 論文の著者 n.trt: 加工カテーテルの数 n.ctrl: 標準カテーテルの数 col.trt: 加工カテーテルのうち、細菌コロニーができてしまった数 col.ctrl: 標準カテーテルのうち、細菌コロニーができてしまった数 inf.trt: 加工カテーテルのうち、血液感染してしまった数。 inf.ctrl: 標準カテーテルのうち、血液感染してしまった数。 cathet

  • ロジスティック回帰の考え方・使い方 - TokyoR #33

    協力ゲーム理論でXAI (説明可能なAI) を目指すSHAP (Shapley Additive exPlanation)西岡 賢一郎

    ロジスティック回帰の考え方・使い方 - TokyoR #33
  • R-Tips

    - R PDF - R S OS S-plus Windows R Mac OS X R Linux R http : //cse.naro.affrc.go.jp/takezawa/r − tips/r.html PDF *1 R R R R ( ) ( ) The R Book ( ) Introductory Statistics with R Peter Dalgaard (Springer) R ( HP ) http : //aoki2.si.gunma − u.ac.jp/R/ R 3 ( ) ( ) ( ) ( ) ( ) \ Y Y R \ Y \ UNIX LINUX Mac OS \ Windows Y OS *1 4 2005 8 8 R 2.1.0 2.1.1 1 I 10 1 11 1.0 R . . . . . . . . . . . . . . . . .

  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • Rによる実証分析 回帰分析から因果分析へ | Ohmsha

    Part Ⅰ 基礎編 第1章 回帰分析の目的 第2章 統計の基礎知識 第3章 確率論の基礎 第4章 回帰分析の基礎 第5章 推測統計の基礎 第6章 相関関係と因果関係 第7章 外生変数と内生変数 Part Ⅱ 実践編 第8章 ランダム化実験 第9章 マッチング法 第10章 不連続回帰デザイン 第11章 操作変数法 第12章 実証分析の手順 付 録 R の導入・基操作 Part Ⅰ 基礎編 第1章 回帰分析の目的 1.1 相関と因果 1.1.1 相関関係と因果関係 1.1.2 擬似相関 1.1.3 相関関係と因果関係は区別できるか 1.2 回帰と予測 1.2.1 直線を当てはめる 1.2.2 回帰分析と予測 1.3 自然科学のデータと社会科学のデータ 1.3.1 社会科学の難しさ 1.3.2 社会科学における実験 第1章のまとめ 第2章 統計の基礎知識 2.1 母集団と標 2.2 無作為

    Rによる実証分析 回帰分析から因果分析へ | Ohmsha
  • R言語入門 | 全人類がわかる統計学

    R言語の入門者~中級者向けのページです。R言語の使い方を手とり足とり教えます!Rに初めて触れる方でも、分かりやすい構成にしてあります。また、Rによる代表的な統計解析を自作関数例を交えて紹介しています。リンクをクリックすると、各説明ページ(別ページ)に飛びます。 ※当サイトでは、”R言語”を、省略して”R”と記述することもあります。 ※当サイトで紹介しているプログラムはRでコピーアンドペーストすることで、実行が可能ですが、macのRの場合、書体(形式?)の問題でエラーすることがあるようです。その場合は、貼り付け時にcommand+alt+Vとすることで解消する場合があります。お困りの方はお試しください。ご迷惑おかけして申し訳ございません。 当ページについて これからR言語の勉強をしたいと考えている方、もしくは今すぐにでもRを使って解析をしたいと考えている方に向けたページです。R言語の初心者や

    R言語入門 | 全人類がわかる統計学
  • 機械学習を学ぶ上で個人的に最強と思う教科書 - Qiita

    動機 いわずもがなですが、機械学習の勉強にはとても時間が掛かります。 でも、同じ勉強時間を費やしたとしても、教材の良し悪しで捗り方が大きく変わってくることは、誰もが実感していることだと思います。 そこで、記事ではテーマごとに私が考える最強の教科書をリストしていこうと思います。 ディープラーニング(アルゴリズムの理解) 「Deep Learning」An MIT Press book, 2016/12 発行 http://www.deeplearningbook.org/ 印刷も売られてますが、上のWebページでいつでもタダで読めます。(版権上の問題でPDFの形では配布できない&してないそうです) このは、ここ数年のディープラーニングの進歩のうち研究者の間ではメジャーとなっているであろうテーマはすべて書いてある、ともいえる内容の広さがありつつ、それぞれのテーマについて理論的背景と具体的

    機械学習を学ぶ上で個人的に最強と思う教科書 - Qiita
  • 生態学データ解析 - FAQ モデル選択

    統計学的なモデル選択 (とくに AIC を使ったモデル選択) についてよくある質問と 久保 によるてきとーなる回答を並べてみました 参照: FAQ 系ペイジ一覧, FAQ stepAIC() モデル選択 [項目] モデル選択とは何ですか モデル選択したあとに検定すればいいのですか? モデル選択規準 AIC が一番小さいモデルは一番あてはまりの良いモデルですか? AIC によって選択された統計モデルってどういう意味で「良い」のですか? AIC で選ばれる統計モデルは標数に影響されますか? AIC が少しでも小さい統計モデルが「良い」モデルなのですか? 統計ソフトウェアが出力する AIC の値だけ確認すればいいのですか? 比較すべき統計モデルの個数が 100 個ぐらいあるんですけど,このときも AIC 最小のモデルを選べばよいのですか? 「パラメーターの重要性」をみるために ``Akaike

  • データサイエンティストを目指す人のpython環境構築 2016 - Qiita

    pythonの環境構築について "python 環境構築"でググると20万件くらいヒットしますが、割と内容が古いです。 タイトルにはデータサイエンティストと書いてありますが、データサイエンティスト以外にもanacondaはおすすめです。 2.x or 3.x? 3.xは動かないライブラリが多いので2.x推奨 > 3.xで動かないライブラリがある、くらいまで来ました。 easy_installでpipを入れて、setuptoolsも入れて、でもwheelというのもあって... > 古いです。 virtualenv 必須 > そんなこともないです。 winでは64bitは不具合が多いので32bit推奨 > 古いです。 winでは非公式バイナリからダウンロードしてインストール > お世話になりましたが、最近は使っていません。 2016版 OS毎python環境構築法決定版 Windows: an

    データサイエンティストを目指す人のpython環境構築 2016 - Qiita
  • https://researchmap.jp/mutjcu9ta-1788230/?action=multidatabase_action_main_filedownload&download_flag=1&upload_id=65194&metadata_id=49144

  • [pdf]「近現代史学教育の課題によせて」野村耕一(三重大学紀要論文、2012)

    三重大学情報教育・研究機構情報ライブラリーセンター機関リポジトリ担当 miuse at ab.mie-u.ac.jp (atを@に変換して下さい。) 電話:059-231-9084

  • 永田靖著「サンプルサイズの決め方」―補助資料― Excel による検出力とサンプルサイズの計算

    2004. 4. 8 | | Excel 0 1 3 1 | 2 3.1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 2 3.2 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3 3.3 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 4 (1) : : : : : : : : : : : : : : : : : : : : : : : : : : 4 (2) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5

  • p値の価値 - himaginary’s diary

    今月初めに米統計学会がp値の使用に関する6つの原則を公表した。その責任者である同学会Executive DirectorのRonald L. Wassersteinは、Retraction Watchという論文撤回監視ブログ*1のインタビューに応じ、最近の再現性危機問題が今回の声明の背景にあることを説明している(H/T Mostly Economics)。日でもこの6原則は各所で取り上げられており、Naverまとめがその辺りに詳しい。 米統計学会のサイトでは、この6原則を提示した声明文書と共に、同文書のp値の議論に関する21人の統計学者の反応も併せて公開している。そのうちUCバークレー教授のPhilip B. Starkが、表題の小論(原題は「The Value of p-Values」)で、今回の声明の精神は買うが、内容には若干の違和感がある、として以下の点を指摘している。 The i

    p値の価値 - himaginary’s diary
  • とある弁当屋の統計技師(データサイエンティスト)

    共立出版『とある弁当屋の統計技師(データサイエンティスト)』サポートサイト