タグ

R言語に関するyue_kのブックマーク (46)

  • Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

    1 主成分分析 2 内容  主成分分析  主成分分析について  成績データの解析  「R」 で主成分分析  相関行列による主成分分析  寄与率・累積寄与率  因子負荷量  主成分得点 3 主成分分析 4 次元の縮小と主成分分析  次元の縮小に関する手法  次元の縮小  国語、数学、理科、社会、英語の総合点 ⇒5次元データから1次元データへの縮約  体形評価 : BMI (Body Mass Index) 判定 肥満度の判定方法の1つで、次の式で得られる。 ⇒ 2次元データを1次元データに縮約 主成分分析 5 主成分分析とは  主成分分析  多次元データのもつ情報をできるだけ損わずに 低次元空間に情報を縮約する方法  多次元データを2次元・3次元データに縮約できれば、 データ全体の雰囲気を視覚化することができる。 視覚化により、データが持つ情報を解釈しやすくなる

    yue_k
    yue_k 2015/07/28
    主成分分析
  • R言語で自然言語処理 〜 第2次安倍内閣 施政方針演説 - Qiita

    (1) 準備: MeCabのダウンロード & インストールを済ませておく。 (URL) https://code.google.com/p/mecab/downloads/list ※ 2014年5月19日 現在 (2) テキストデータ準備:(歴代内閣 施政方針演説) 首相官邸サイトから、手でエディタにコピー&ペースト (URL)http://www.kantei.go.jp/jp/noda/statement2/index.html" class="autolink">http://www.kantei.go.jp/jp/noda/statement2/index.html">http://www.kantei.go.jp/jp/noda/statement2/index.html ※ 節番号や、節の表題、冒頭の空白文字 を削除 【ファイル名】 siseihousin.AbeCabine

    R言語で自然言語処理 〜 第2次安倍内閣 施政方針演説 - Qiita
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
    yue_k
    yue_k 2015/07/27
     アソシエーション分析
  • 前処理なしのトランザクションデータを{arules}パッケージで読み込む方法 - 渋谷駅前で働くデータサイエンティストのブログ

    実は僕は結構頻繁に{arules}パッケージを使うんですが*1、個人的には汎用性を考えて必ず素性ベクトルの形になるようにデータを前処理して読み込むようにしています。例えばこんな感じ。 ビール ソーセージ 牛肉 ... 1 0 1 ... 0 1 0 ... 1 1 1 ... ... ... ... ... なのですが、場合によっては前処理なしでただベタっとアイテムリストが個々のトランザクションごとに並んでるだけのデータを扱わなきゃいけないことも多いと思います。つまり、こんな感じのデータです。 ビール, 牛肉 ソーセージ ビール, ソーセージ, 牛肉 ... こういう場合、素性ベクトルの形に直そうとすると際限なくカラム方向に伸びていってしまうことが多く、前処理自体が非常に厄介になったりします。そこで、そういう時に出来る限り面倒な操作をせずに{arules}パッケージで扱える形に読み込む方法

    前処理なしのトランザクションデータを{arules}パッケージで読み込む方法 - 渋谷駅前で働くデータサイエンティストのブログ
    yue_k
    yue_k 2015/07/27
     トランザクション分析グラフ
  • 時系列データ

    タイムゾーンについて R 3.5.0/3.5.1 (Windows/Mac) で as.POSIXct("1948-05-02") がエラーになる: as.POSIXct("1948-05-01") [1] "1948-05-01 JST" as.POSIXct("1948-05-02") as.POSIXlt.character(x, tz, ...) でエラー: 文字列は標準的な曖昧さのない書式にはなっていません as.POSIXct("1948-05-03") [1] "1948-05-03 JDT" 原因はどうやら日でも1948年〜1951年にあった夏時間(JDT)のためらしい。"1948-05-02" は "1948-05-02 00:00:00" と解釈されて,夏時間を考慮すれば存在しない時刻になるのだろう。ただ,同じコードでもLinux上ではエラーにならない: as.POS

    yue_k
    yue_k 2015/07/23
    時系列データ扱い 時系列グラフ
  • Rプログラム (TAKENAKA's Web Page)

    plotで散布図が一枚書けたというレベルから, 使える図を作るレベルへと進むには 描画を制御するパラメータを適切に設定できる 描画関数を何度も呼び出して重ね描きができる ことがポイントになります. このページでは,まずはパラメータの設定について説明します. とくに,文字のサイズやシンボルのサイズを自由に制御する方法を解説します. 続いて,高水準関数を何度も呼び出したり,高水準関数と低水準関数を 組み合わせたりして重ね描きするときの注意点を説明します. この場合は,座標系の設定の理解が重要になります. これらを理解すれば,プログラムで作図することもおっくうでなくなるでしょう. なお,グラフ描きのためのさまざまなワザを網羅的に紹介することはしません. 実用的な見栄えの,ごくふつうのグラフを描くための基礎に限って紹介します. もっと凝ったことがやりたくなったら,自分で調べてみてください. なお,

    yue_k
    yue_k 2015/06/24
     グラフ設定 作図関数とparで設定する違い
  • Rプログラム (TAKENAKA's Web Page)

    R でプログラミング:データの一括処理とグラフ描き started on 2005-06-06 updated on 2017-09-16 竹中明夫 この文書は,フリーの統計解析・作図システム R を使って, データの一括処理と図化のプログラムを書けるようになるためのチュートリアルです. R の経験がまったくなくても読めるように書いています. ただし統計解析手法そのものについての解説はほとんどしていません. ひとつ覚えた統計解析用の関数を使って、 数十セットのデータを一度に処理しりたいとか、 ついでに自動的に作図してしまいたいとか、 統計解析の前にデータを一通りグラフにして全体像を見たいとか、 解析・作図の手順をプログラムとして書きとめ、 再利用できるようにしたいといった要望に応えるための文書です。 まずは はじめに:この文書のねらい をごらんください。 終りにでも、この文書の守備範囲に触

    yue_k
    yue_k 2015/06/17
    データの一括処理とグラフ描き
  • R日記の作り方 Sweaveを使う - ryamadaの遺伝学・遺伝統計学メモ

    20091222の日記にコメントをいただきました(こちら)。Sweaveを使ったRの記録作りのことです。 Rを立ち上げます(WindowsXPで使っています) 「今日の作業」をします 作業ディレクトリが"C:\Documents and Settings\MyName\My Documents\RDiary\rd20100106"とします。 Rのツールバー「ファイル」から、「ディレクトリの変更」を選んで、このディレクトリを指定します。 今日、R作業で使う入力ファイルなどは、みなここに納めることにします。 たとえば、ここに"rand.txt"というファイルがあるとします。これを読み込んでソートしてプロットするのが今日の作業とします。 コマンドは以下の通りです。 data<-read.table("rand.txt") sort(data$V1) plot(sort(data$V1)) q()

    R日記の作り方 Sweaveを使う - ryamadaの遺伝学・遺伝統計学メモ
  • RとTeXのいい関係

    最近のマイブームはTeXです。たぶん[改訂第6版] LaTeX2ε美文書作成入門がでて,Texlive2013ベースで導入するようになり,導入の敷居が低くなった=プラットフォーム化がすすんだことが原因の一つなんだろうと思う。これでうちみたいな文系心理の学生にも紹介しやすくなったし。 ところで,昨日必要に迫られて(理由はこちら)psychパッケージのヘルプを読んでいたら,ずいぶんと便利な関数があることを知った。psychパッケージの結果をTeX出力してくれる関数群だ。結果の美しさに感動したので,ついでにRとTeXのつなぎ方について,わかったことを書いておく。ここで紹介するのは, RstudioのSweave機能 xtablesパッケージ psychパッケージのいくつかの関数 です。 1.RstudioでSweaveする これはRStudioで新規Sweaveファイルを開くだけの簡単な方法。d

    RとTeXのいい関係
  • Rで描いたグラフ中の数式をLaTeXで書き換える[R]

    こちらのブログには認証がかかっています。 ユーザー名 パスワード Powered by Seesaa

  • Rプログラム (TAKENAKA's Web Page)

    R でプログラミング:データの一括処理とグラフ描き 11. データファイルの順次処理:ファイル名のいろいろな決め方 まずは前の章の復習です.いくつものデータファイルを読んで処理する場合の基的な 流れは, for (...){ # ファイルごとの繰り返し ファイル名を設定する. ファイルの内容を読み込む. 読み込んだデータを使ってなんらかの処理をする. } とうものでした.前の章では,読み込むデータファイルの名前を プログラム中に書き並べるという素朴な方法をためしてみました. この章では,ほかの方法を紹介します. ファイル名を規則的に生成する ファイル名が規則的についているなら,プログラムのなかで生成することができます. こういうプログラムが書きやすいように,データファイルを作る段階からファイル名に 工夫をしておくとよいでしょう. プログラム中でのファイル名生成には, sprintf が活

  • tidyr: シンプルなデータ変形ツール

    data.frameを縦長・横広・入れ子に変形・整形するためのツール。 dplyr や purrr と一緒に使うとよい。 reshape2 を置き換えるべく再設計された改良版。 tidyverse に含まれているので、 install.packages("tidyverse") で一括インストール、 library(tidyverse) で一括ロード。 https://r4ds.hadley.nz/data-tidy.html https://github.com/tidyverse/tidyr vignette("tidy-data") demo(package = "tidyr") https://speakerdeck.com/yutannihilation/tidyr-pivot パイプ演算子 |> についてはdplyrを参照。 Pivoting: 縦長 ↔ 横広 https://

    tidyr: シンプルなデータ変形ツール
    yue_k
    yue_k 2015/06/09
    melt
  • reshape2でデータ整形 - My Life as a Mock Quant

    パッケージのサンプルを例に手を動かす。 まずはパッケージのロード&使うデータ(airquality)の確認。 このairqualityデータフレームは「ozone,solar.r,wind,temp,month,day」を列に持つデータフレームということ。 > library(reshape2) > names(airquality) <- tolower(names(airquality)) > str(airquality) 'data.frame': 153 obs. of 6 variables: $ ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ solar.r: int 190 118 149 313 NA NA 299 99 19 194 ... $ wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6

    reshape2でデータ整形 - My Life as a Mock Quant
    yue_k
    yue_k 2015/06/09
    melt
  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • 【 R言語 】アソシエーション分析の結果はいろんなグラフに出力できる - Qiita

    ネットサーフィンをしていたら、以下のサイト( リンク先 Hatena Diary Analyze IT に面白い事が書いてあった 【 書かれていたこと 】 アソシエーション分析の結果はいろんなグラフに出力できる! 面白かったので、上記サイトを丸写し(写経)して実行してみた ※ arules パッケージの組み込みデータ Grocieries でアソシエーション分析した結果をいろんなグラフをつかって可視化していきます 1. 3次元散布図 library(arules) library(arulesViz) data(Groceries) rules <- apriori(Groceries, parameter=list(support=0.001, confidence=0.5, maxlen=6)) plot(rules)

    【 R言語 】アソシエーション分析の結果はいろんなグラフに出力できる - Qiita
    yue_k
    yue_k 2015/06/05
    plot系
  • 43. データの結合(マージ)と整列(ソート) - R-Source

    x と y を併合(マージ)する.通常は引数に all=T を指定し,データを全て残す.all=T を指定しなければデータの共通部分が結果として返される. id <- c("A","C","E") height <- c(158,177,166) D1 <- data.frame(ID=id, H=height) id <- c("A","B","D","E") weight <- c( 51, 55, 57, 55) D2 <- data.frame(ID=id, W=weight)

    yue_k
    yue_k 2015/06/05
    データ結合
  • biunit

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

  • Rの関数定義の基本 - RjpWiki

  • R-Source

    mydouble <- function(x) 2*x mydouble <- function(x) { return( 2*x ) # 上と同じ関数定義 } mydouble(2) [1] 4 新しい演算子の定義 新しい演算子を定義することも出来る.以下では R には用意されていないインクリメント演算子 %+=% ,%-=% を定義している.以下に示した通り,新しく作成した演算子を定義する場合は演算子を ”” で囲まなければならない. "%+=%" <- function(x, y) x <<- x + y "%-=%" <- function(x, y) x <<- x - y x <- 1; (x %+=% 2) [1] 3 (x %-=% 3) [1] 0 関数の返す値(返り値) R では手続きも関数もそれぞれ「関数」と呼ぶのだが,来の関数として用いるのならば返す値を明示的に指

  • row.names で merge する - Qiita

    Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up

    row.names で merge する - Qiita