タグ

yue_kのブックマーク (238)

  • Rの関数の中身を知りたい - J's blog

    Rの関数の中身を知りたい時のお話です。 基的には、 > 関数名 としてしまえば下のmatrix関数のように参照することができます。 > matrix function (data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL) { if (is.object(data) || !is.atomic(data)) data <- as.vector(data) .Internal(matrix(data, nrow, ncol, byrow, dimnames, missing(nrow), missing(ncol))) } <bytecode: 0x7f8ffc2bad78> <environment: namespace:base> しかし、aggregate関数のように > aggregate function (

    Rの関数の中身を知りたい - J's blog
  • 統計学事始め:ダミー変数について

    こんばんは、統計学ド素人のまるごし三平です。 今回はダミー変数 (dummy variable) について簡単に触れておきましょう。 ダミー変数というのは、 ・ある条件を満たす⇒ 1 ・ある条件を満たさない⇒ 0 であるような変数のことを言います。具体的な例として、典型的なものですが、 ・性別を考慮する →女性ならば 1、それ以外は 0 ・市の財政を調査する →政令都市ならば 1、それ以外は 0 といったものです。たいていの場合、質的な情報で二つのカテゴリーに分けることができる(ある条件にあてはまる、あるいは当てはまらない)ものに対して使います。 そして、ダミー変数には ・定数項ダミー ( intercept dummy ) ・係数ダミー ( slope dummy ) があります。これらの効果は、直線の方程式 Yi = ai + bi Xi に対して、 Yi = ( ai + ci )

    統計学事始め:ダミー変数について
  • 決定係数 - Wikipedia

    決定係数(けっていけいすう、(英: coefficient of determination、R2)は、統計学において、独立変数(説明変数)が従属変数(目的変数)のどれくらいを説明できるかを表す値である。寄与率と呼ばれることもある。標値から求めた回帰方程式(モデル)のあてはまりの良さの尺度として利用される。 決定係数 のはっきりと合意された定義は無い。タロル・クヴォルセス[1]によれば、8種類の定義があり注意が必要だとしている[2]。 しかし、以下の式を定義とするのが一般的なようである。標値(実測値、観測値)を 、回帰方程式による推定値を とする。 すなわち、残差の二乗和を標値の平均値 からの偏差の二乗和で割ったものを1から引いた値であり、1に近い程相対的な残差が少ないことを表す。最小二乗法はこの定義を最大にするようなパラメータの選択法である。値域は1以下の実数。よく見かける値は0~

    yue_k
    yue_k 2015/05/26
  • (おまけ) イラストでわかる自由度と不偏分散 

    文に戻る (おまけ) イラストでわかる自由度と不偏分散 標準偏差を計算するときに、なぜデータ個数ではなく自由度 n-1 を使うの? そもそも自由度って何? というご質問を受ける。 標準偏差の計算と自由度の関係がわかりにくいということで、文にバラバラに書いてあるものを、そこだけまとめなおしてみました。 <不偏分散の公式> 平方和S 不偏分散V=━━━━━━━━ 自由度n-1 不偏分散は 標準偏差 2(σ 2)の最もよい推定値になっています。偏っていないという意味で不偏と名づけられています。いっぽう、平方和をデータ個数で割ると、真の標準偏差値より小さめの数値となります。 標準偏差とは何か (真の平均 μ で算出したとき) 標準偏差とは何かを知るために、まず面積の平均値を計算することからはじめよう。 Q: いろいろな大きさの正方形があります。この平均的な面積の正方形をどうやって描けば いい?

    yue_k
    yue_k 2015/05/25
  • データ & アナリティクス | アクセンチュア

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    データ & アナリティクス | アクセンチュア
    yue_k
    yue_k 2015/05/21
  • 主成分分析の基礎知識

    検索エンジンから直接きたひとは、フレーム目次が便利です。ここは 4章から入ります。 お急ぎで「主成分分析とは」を知りたい方は簡略版へどうぞ。 エクセルで層別散布図・等高線図を描きたい人は(おまけ)へ。 主成分といえば、むずかしそうに聞こえる。でももう君達は高校生のときに学校で教わっているのさ。 X軸とY軸の散布図を書いて、点々の真中ほどに直線を引いたろう?あれが第1主成分。 一番データの点々の広がった部分に直線を引いたはずだね。 第2主成分は、XとYの平均値(重心)を通って、第1主成分である直線に直角の線を引くと出来上がり。 主成分分析の計算過程を数学音痴向けに説明するね。 空中にまとまった点々があるから思い浮かべなさい。カトンボが空中を舞っている姿とか、子魚が群れをなして泳いでいる姿を思い浮かべるのじゃよ。 点々の分布が一番広がったところに、重心をとおってまず最初の直線を引きます。 フラ

    yue_k
    yue_k 2015/05/21
     おバカにもわかりやすい
  • Rのバージョン3.2.0がリリース|Colorless Green Ideas

    統計処理言語の R のバージョン3.2.0が、2015年4月16日に公開された。この新リリースでの主な変更点について解説する。 バージョン3.2.0のリリース 2015年4月16日、R のバージョン3.2.0がリリースされた。コードネームは Full of Ingredients(素材でいっぱい)である。バージョン3.1.0がリリースされたのは、2014年4月10日なので、およそ1年を経てマイナーバージョンアップが行われたことになる [1] 。(2016年5月6日:この段落の誤字修正) Rのバージョン3.2.0のコードネームは Full of Ingredients(素材でいっぱい)である。 [2] バージョン3.2.0での変更点の詳細は、Rアナウンスメーリングリストでのバージョン3.2.0リリースの通知(R 3.2.0 is released、英語)を参照されたい。 バージョン3.2.0

    Rのバージョン3.2.0がリリース|Colorless Green Ideas
  • RPubs - クラスター分析による分類とその後の展開

    Hide Comments (–) Share Hide Toolbars

    yue_k
    yue_k 2015/05/19
    クラスター分析 関数による結果の比較
  • Sign in - Google Accounts

    Not your computer? Use a private browsing window to sign in. Learn more

  • R パッケージのインストール

    R パッケージのインストール(R コマンダーの例) 今年度(2009年度)から始まった「農環研 統計GISコース」のため, R-2.9.0 のインストールに続いて,パッケージをインストールした。 以下は,その記録である (2009年5月)。 R体を R-2.10.1 にアップデートしたのに伴なって, パッケージもアップデートした。 なお,パッケージをアップデートする場合には, Rの中から "Update packages..." を実行するよりも, 古いパッケージのディレクトリを削除して (あるいは用心のため名前を変えて取っておいて) 新たにインストールした方が早い (2010年3月)。 以下の説明文の中で, 「ディレクトリ」という用語は「フォルダ」と同義である。 1. パッケージ用ディレクトリ 2. パッケージのインストール 3. Vista へのインストールについて 4. 『指定され

  • Index of /bin/windows/contrib

    Apache/2.2.9 (Debian) DAV/2 PHP/5.2.6-3 with Suhosin-Patch mod_python/3.3.1 Python/2.5.2 mod_ruby/1.2.6 Ruby/1.8.7(2008-08-11) mod_ssl/2.2.9 OpenSSL/0.9.8g mod_wsgi/2.5 Phusion_Passenger/2.2.11 mod_perl/2.0.4 Perl/v5.10.0 Server at cran.md.tsukuba.ac.jp Port 80

  • RStudio - 浅井拓也 研究室用ページ

    要はR言語用のIDE。手持ちのパソコンにRが入っていなくてもクラウドで動かせるらしい(メリットあんま感じないけど)。コマンドの保管機能等が結構よいらしい。あとサーバーでRを使用する場合に結構メリットがあるらしい。今のところ私はスタンドアローンでしか使用していないのでこれについてはおいおい検証していこうかと。

  • An Introduction to R を読む (3) - 配列と行列

    ベクトルに dim 属性を与えると、配列 (array) になる。 dim 属性はベクトルで与えられ、次元ベクトル (dimention vector) と呼ばれる。この次元ベクトルの大きさ k に応じて、配列は k 次元であると言う。 ベクトル → dim を設定することにより → 配列 試してみる。 > a <- 1:24 > a [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 > dim(a) <- c (4,6) > a [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 5 9 13 17 21 [2,] 2 6 10 14 18 22 [3,] 3 7 11 15 19 23 [4,] 4 8 12 16 20 24 > dim(a) <- c(3,4,2) > a ,

    An Introduction to R を読む (3) - 配列と行列
  • R言語で統計解析入門: 目次1 テクニカルデータプレゼンテーション  梶山 喜一郎

    Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室   梶山 喜一郎 ・つまみいで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の

  • R の環境設定 - 知に至る病

    2001-01-01 R の環境設定 R 手順 特に凝ったことをしないのであれば,以下の手順にしたがって設定を行うだけで十分です。Windows 環境であれば,ちょっとした R のことで提供されている R User Configuration を使用するとボタン一発でほぼ同様の設定ができます。 環境変数 $HOME にホームディレクトリのパスを設定する。 ホームディレクトリに以下の設定ファイルを配置する。 .Rprofile Rconsole Rdevga パッケージのインストール先を指定したい場合やパッケージを R のバージョンごとに分けたくない場合は,ホームディレクトリに .Renviron という名前の設定ファイルを作成し,その中で環境変数 $R_LIBS_USER にパッケージのインストール先のパスを設定する。 なお,Windows 環境ではホームディレクトリとして $R_USER

    R の環境設定 - 知に至る病
  • Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas

    はじめに Rには、“ggplot2”というライブラリがある。このライブラリを使うと、デフォルトの作図コマンドよりも効率的に作図ができ、しかも分かりやすくて美しい図を描くことができる。美しい図といってもピンと来ないかもしれないが、百聞は一見にしかず、下の2つの図を比べてもらいたい。1つ目の白い背景の図がRのデフォルトの作図コマンドで作成された散布図である。2つ目の灰色の背景の図が“ggplot2”を使った散布図である。 Rのデフォルトの作図機能を使った場合の散布図の例 “ggplot2”を使った場合の散布図の例 以下では、“ggplot2”のコンセプトと簡単な作例を紹介したいと思う。最初は抽象的な話をする。このため、最初から読んで分かりづらかったら、後の方の作例を先に見た方が理解が早いかもしれない。 “ggplot2”のコンセプト “ggplot2”は、どのように作図を行っているのであろうか

    Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas
  • 凡例(legend関数)について - 日々のつれづれ

    legend関数は引数が多く、par関数でグラフィックパラメータを調整すれば、細かいアレンジができるので便利。 barplot関数のように、引数で凡例を持つ関数もある。 四隅にlegendを描きたいときは、"topleft","topright","bottomleft","bottomright"を指定する。 > dat <- cbind(A=sample(10,3),B=sample(10,3),C=sample(10,3)) > > jpeg("legend.jpg") > matplot(t(dat),col=1:3,lwd=1:3,pch=20,type="b",xlim=c(0,3)+.5,xaxt="n") > axis(side=1,at=1:3,labels=colnames(dat)) > legend("topleft",legend=colnames(dat),pc

    凡例(legend関数)について - 日々のつれづれ
  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • R-Source

    グラフィックスパラメータ 高水準作図関数や低水準作図関数で作図する場合,作図関数固有のパラメータ以外にもグラフィックスパラメータと呼ばれるパラメータを指定することが出来る.これにより作図結果の微妙なカスタマイズを行うことが出来,自分好みの出力結果を得ることが出来る. グラフィックスパラメータ事始 グラフィックスパラメータを設定する方法は,作図関数の引数にパラメータを与える方法と,関数 par() を使って設定する方法の 2 通りがある.前者は一時的にパラメータ値が変更され,後者は永続的にパラメータ値が変更される.重要なことは,グラフィックスパラメータの全てがこの 2 通りの方法で変更出来るわけではなく,一部のグラフィックスパラメータは関数 par() を使ってしかパラメータ値を変更することが出来ない点を理解することである.例えば,色に関するグラフィックスパラメータ col を赤に設定する方

  • biunit

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。