[B! R言語] yue_kのブックマーク

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

1 主成分分析 2 内容  主成分分析  主成分分析について  成績データの解析  「R」で主成分分析  相関行列による主成分分析  寄与率・累積寄与率  因子負荷量  主成分得点 3 主成分分析 4 次元の縮小と主成分分析  次元の縮小に関する手法  次元の縮小  国語、数学、理科、社会、英語の総合点 ⇒５次元データから１次元データへの縮約  体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の１つで、次の式で得られる。 ⇒ ２次元データを１次元データに縮約主成分分析 5 主成分分析とは  主成分分析  多次元データのもつ情報をできるだけ損わずに低次元空間に情報を縮約する方法  多次元データを２次元・３次元データに縮約できれば、データ全体の雰囲気を視覚化することができる。視覚化により、データが持つ情報を解釈しやすくなる

yue_k 2015/07/28

主成分分析

R言語

リンク

R言語で自然言語処理〜第2次安倍内閣施政方針演説 - Qiita

(1) 準備: MeCabのダウンロード & インストールを済ませておく。 (URL) https://code.google.com/p/mecab/downloads/list ※ 2014年5月19日現在 (2) テキストデータ準備:（歴代内閣施政方針演説）首相官邸サイトから、手でエディタにコピー&ペースト (URL)http://www.kantei.go.jp/jp/noda/statement2/index.html" class="autolink">http://www.kantei.go.jp/jp/noda/statement2/index.html">http://www.kantei.go.jp/jp/noda/statement2/index.html ※ 節番号や、節の表題、冒頭の空白文字を削除【ファイル名】 siseihousin.AbeCabine

yue_k 2015/07/27

R言語

リンク

株式会社ALBERT（レコメンドエンジン）

データ分析から導き出されたインサイト無しにAI（人工知能）の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって本当に必要なデータを活用するための方法を知っています。将来を見据えたオペレーション体制を備えている企業の半数以上（52％）は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

yue_k 2015/07/27

　アソシエーション分析

R言語

リンク

前処理なしのトランザクションデータを{arules}パッケージで読み込む方法 - 渋谷駅前で働くデータサイエンティストのブログ

実は僕は結構頻繁に{arules}パッケージを使うんですが*1、個人的には汎用性を考えて必ず素性ベクトルの形になるようにデータを前処理して読み込むようにしています。例えばこんな感じ。ビールソーセージ牛肉 ... 1 0 1 ... 0 1 0 ... 1 1 1 ... ... ... ... ... なのですが、場合によっては前処理なしでただベタっとアイテムリストが個々のトランザクションごとに並んでるだけのデータを扱わなきゃいけないことも多いと思います。つまり、こんな感じのデータです。ビール, 牛肉ソーセージビール, ソーセージ, 牛肉 ... こういう場合、素性ベクトルの形に直そうとすると際限なくカラム方向に伸びていってしまうことが多く、前処理自体が非常に厄介になったりします。そこで、そういう時に出来る限り面倒な操作をせずに{arules}パッケージで扱える形に読み込む方法

yue_k 2015/07/27

　トランザクション分析グラフ

R言語

リンク

時系列データ

タイムゾーンについて R 3.5.0/3.5.1 (Windows/Mac) で as.POSIXct("1948-05-02") がエラーになる： as.POSIXct("1948-05-01") [1] "1948-05-01 JST" as.POSIXct("1948-05-02") as.POSIXlt.character(x, tz, ...) でエラー: 文字列は標準的な曖昧さのない書式にはなっていません as.POSIXct("1948-05-03") [1] "1948-05-03 JDT" 原因はどうやら日本でも1948年〜1951年にあった夏時間（JDT）のためらしい。"1948-05-02" は "1948-05-02 00:00:00" と解釈されて，夏時間を考慮すれば存在しない時刻になるのだろう。ただ，同じコードでもLinux上ではエラーにならない： as.POS

yue_k 2015/07/23

時系列データ扱い　時系列グラフ

R言語

リンク

Rプログラム (TAKENAKA's Web Page)

plotで散布図が一枚書けたというレベルから，使える図を作るレベルへと進むには描画を制御するパラメータを適切に設定できる描画関数を何度も呼び出して重ね描きができることがポイントになります．このページでは，まずはパラメータの設定について説明します．とくに，文字のサイズやシンボルのサイズを自由に制御する方法を解説します．続いて，高水準関数を何度も呼び出したり，高水準関数と低水準関数を組み合わせたりして重ね描きするときの注意点を説明します．この場合は，座標系の設定の理解が重要になります．これらを理解すれば，プログラムで作図することもおっくうでなくなるでしょう．なお，グラフ描きのためのさまざまなワザを網羅的に紹介することはしません．実用的な見栄えの，ごくふつうのグラフを描くための基礎に限って紹介します．もっと凝ったことがやりたくなったら，自分で調べてみてください．なお，

yue_k 2015/06/24

　グラフ設定　作図関数とｐａｒで設定する違い

R言語

リンク

Rプログラム (TAKENAKA's Web Page)

R でプログラミング：データの一括処理とグラフ描き started on 2005-06-06 updated on 2017-09-16 竹中明夫この文書は，フリーの統計解析・作図システム R を使って，データの一括処理と図化のプログラムを書けるようになるためのチュートリアルです． R の経験がまったくなくても読めるように書いています．ただし統計解析手法そのものについての解説はほとんどしていません．ひとつ覚えた統計解析用の関数を使って、数十セットのデータを一度に処理しりたいとか、ついでに自動的に作図してしまいたいとか、統計解析の前にデータを一通りグラフにして全体像を見たいとか、解析・作図の手順をプログラムとして書きとめ、再利用できるようにしたいといった要望に応えるための文書です。まずははじめに：この文書のねらいをごらんください。終りにでも、この文書の守備範囲に触

yue_k 2015/06/17

データの一括処理とグラフ描き

R言語

リンク

Ｒ日記の作り方 Sweaveを使う - ryamadaの遺伝学・遺伝統計学メモ

20091222の日記にコメントをいただきました(こちら)。Sweaveを使ったＲの記録作りのことです。Ｒを立ち上げます(WindowsXPで使っています) 「今日の作業」をします作業ディレクトリが"C:\Documents and Settings\MyName\My Documents\RDiary\rd20100106"とします。Ｒのツールバー「ファイル」から、「ディレクトリの変更」を選んで、このディレクトリを指定します。今日、Ｒ作業で使う入力ファイルなどは、みなここに納めることにします。たとえば、ここに"rand.txt"というファイルがあるとします。これを読み込んでソートしてプロットするのが今日の作業とします。コマンドは以下の通りです。 data<-read.table("rand.txt") sort(data$V1) plot(sort(data$V1)) q()

yue_k 2015/06/16

リンク

RとTeXのいい関係

最近のマイブームはTeXです。たぶん[改訂第6版] LaTeX2ε美文書作成入門がでて，Texlive2013ベースで導入するようになり，導入の敷居が低くなった＝プラットフォーム化がすすんだことが原因の一つなんだろうと思う。これでうちみたいな文系心理の学生にも紹介しやすくなったし。ところで，昨日必要に迫られて(理由はこちら)psychパッケージのヘルプを読んでいたら，ずいぶんと便利な関数があることを知った。psychパッケージの結果をTeX出力してくれる関数群だ。結果の美しさに感動したので，ついでにRとTeXのつなぎ方について，わかったことを書いておく。ここで紹介するのは， RstudioのSweave機能 xtablesパッケージ psychパッケージのいくつかの関数です。 1.RstudioでSweaveするこれはRStudioで新規Sweaveファイルを開くだけの簡単な方法。d

yue_k 2015/06/16

R言語

リンク

Rで描いたグラフ中の数式をLaTeXで書き換える[R]

こちらのブログには認証がかかっています。ユーザー名パスワード Powered by Seesaa

yue_k 2015/06/11

リンク

Rプログラム (TAKENAKA's Web Page)

R でプログラミング：データの一括処理とグラフ描き 11. データファイルの順次処理：ファイル名のいろいろな決め方まずは前の章の復習です．いくつものデータファイルを読んで処理する場合の基本的な流れは， for (...）{ # ファイルごとの繰り返しファイル名を設定する．ファイルの内容を読み込む．読み込んだデータを使ってなんらかの処理をする． } とうものでした．前の章では，読み込むデータファイルの名前をプログラム中に書き並べるという素朴な方法をためしてみました．この章では，ほかの方法を紹介します．ファイル名を規則的に生成するファイル名が規則的についているなら，プログラムのなかで生成することができます．こういうプログラムが書きやすいように，データファイルを作る段階からファイル名に工夫をしておくとよいでしょう．プログラム中でのファイル名生成には， sprintf が活

yue_k 2015/06/09

R言語

リンク

tidyr: シンプルなデータ変形ツール

data.frameを縦長・横広・入れ子に変形・整形するためのツール。 dplyr や purrr と一緒に使うとよい。 reshape2 を置き換えるべく再設計された改良版。 tidyverse に含まれているので、 install.packages("tidyverse") で一括インストール、 library(tidyverse) で一括ロード。 https://r4ds.hadley.nz/data-tidy.html https://github.com/tidyverse/tidyr vignette("tidy-data") demo(package = "tidyr") https://speakerdeck.com/yutannihilation/tidyr-pivot パイプ演算子 |> についてはdplyrを参照。 Pivoting: 縦長 ↔ 横広 https://

yue_k 2015/06/09

melt

R言語

リンク

reshape2でデータ整形 - My Life as a Mock Quant

パッケージのサンプルを例に手を動かす。まずはパッケージのロード＆使うデータ（airquality）の確認。このairqualityデータフレームは「ozone,solar.r,wind,temp,month,day」を列に持つデータフレームということ。 > library(reshape2) > names(airquality) <- tolower(names(airquality)) > str(airquality) 'data.frame': 153 obs. of 6 variables: $ ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ solar.r: int 190 118 149 313 NA NA 299 99 19 194 ... $ wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6

yue_k 2015/06/09

melt

R言語

リンク

R による統計処理

「Rによる統計解析」オーム社刊サポートページ目次第1章　Rを使ってみる第2章　データの取り扱い方第3章　一変量統計第4章　二変量統計第5章　検定と推定第6章　多変量解析第7章　統合化された関数を利用する第8章　データ分析の例付録A　Rの解説付録B　Rの参考図書などはじめに R とは何か，何ができるかのリンク集（日本のもののみ） R を使うためにはどうしたらいいの？データなどの読み書き R の定石（R に限らずプログラミングの定石も） R を使って実際に統計解析をする AtoZ 一連の流れデータファイルの準備をする分析してみる分析結果を LaTeX で処理したり，ワープロに貼り込んだりする道具立て連続変数データをカテゴリーデータに変換カテゴリーデータの再カテゴリー化度数分布表と度数分布図の作成散布図・箱髭図の描画クロス集計（独立性の検定，フィ

yue_k 2015/06/08

R言語

リンク

【 R言語】アソシエーション分析の結果はいろんなグラフに出力できる - Qiita

ネットサーフィンをしていたら、以下のサイト（リンク先 Hatena Diary Analyze IT に面白い事が書いてあった【書かれていたこと】アソシエーション分析の結果はいろんなグラフに出力できる！面白かったので、上記サイトを丸写し（写経）して実行してみた ※ arules パッケージの組み込みデータ Grocieries でアソシエーション分析した結果をいろんなグラフをつかって可視化していきます 1. 3次元散布図 library(arules) library(arulesViz) data(Groceries) rules <- apriori(Groceries, parameter=list(support=0.001, confidence=0.5, maxlen=6)) plot(rules)

yue_k 2015/06/05

plot系

R言語

リンク

43. データの結合（マージ）と整列（ソート） - R-Source

x と y を併合（マージ）する．通常は引数に all=T を指定し，データを全て残す．all=T を指定しなければデータの共通部分が結果として返される． id <- c("A","C","E") height <- c(158,177,166) D1 <- data.frame(ID=id, H=height) id <- c("A","B","D","E") weight <- c( 51, 55, 57, 55) D2 <- data.frame(ID=id, W=weight)

yue_k 2015/06/05

データ結合

R言語

リンク

biunit

農学生命情報科学特論 I ＠東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

yue_k 2015/06/04

R言語

リンク

Rの関数定義の基本 - RjpWiki

yue_k 2015/06/04

R言語

リンク

R-Source

mydouble <- function(x) 2*x mydouble <- function(x) { return( 2*x ) # 上と同じ関数定義 } mydouble(2) [1] 4 新しい演算子の定義新しい演算子を定義することも出来る．以下では R には用意されていないインクリメント演算子 %+=% ，%-=% を定義している．以下に示した通り，新しく作成した演算子を定義する場合は演算子を ”” で囲まなければならない． "%+=%" <- function(x, y) x <<- x + y "%-=%" <- function(x, y) x <<- x - y x <- 1; (x %+=% 2) [1] 3 (x %-=% 3) [1] 0 関数の返す値（返り値） R では手続きも関数もそれぞれ「関数」と呼ぶのだが，本来の関数として用いるのならば返す値を明示的に指

yue_k 2015/06/04

R言語

リンク

row.names で merge する - Qiita

Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up

yue_k 2015/06/04

R言語

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

R言語に関するyue_kのブックマーク (46)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス