(2019年12月26日追記) 普段からエクセルを使い慣れている人にとっては、「検索と置換」はよく使う機能だと思う。 Rのデータフレームで同様の処理をする機会があり、素人なりに方法を調べたのでまとめてみた。 データフレームの準備 適当なデータでデータフレームを作成。ベクトルを合成してデータフレームを作ると、デフォルトでは文字列がfactor型になってしまうので、引数でstringsAsFactors = FALSEを指定する。 x <- c("abc","cde","efg","ghi","ijk","klm") x2 <- c("Alice","Bob","Charles","Deven","Eve","Feldman") y <- c(TRUE,FALSE,TRUE,TRUE,TRUE,FALSE) z <- c(1,3,5,2,4,7) df<- data.frame(X=x, X2
三列目は性別を表していて、1=male(男性)、2=female(女性)である。四列目はアンケートの回答を表していて、0=no、1=yesである。これを文字列を含んだデータに直したいというのが今回の課題。 データ生成 上記のテーブルをRに組み込む。csvからの読み込みを想定してdata.frameにしておく。 NAME <- c("Taro", "Hanako", "Jiro") HEIGHT <- c(170.6, 158.3, 172.1) SEX <- c(1, 2, 1) y <- c(0, 0, 1) dat <- data.frame(NAME, HEIGHT, SEX, y) dat
R で小数点第○○位まで出したい、というときは、Excel でもおなじみの Round 関数が使える。 round(データ, 桁数) round(0.12345, 3) output 0.123 ただこれだと、小数点以下の最後が 0 だった場合、0 より手前までしか表示されない。 round(0.12000, 3) output 0.12 これを、"0.120" のように最後の "0" まで表示させたいときには、format 関数を使うと良い。 format(データ, nsmall = 桁数) format(0.12000, nsmall = 3) output 0.120 でも、format だけだと、"0" で終わらない数字は四捨五入されない…… テーブルとかで一気に表示したい場合が多いと思うので、どちらも OK にするために、round 関数と format 関数を組み合わせるとbe
read.table() でファイルをデータフレームに読み込むとき、ヘッダーに R の変数として使用できない文字があると . に自動的に変換されます。 例えば、下記のようなデータがあったとき、 Name Value(1hours) Value(2hours) Value(3hours) #ofCount
Rでの主成分分析の実行 前々回のエントリで学習した永田・棟近教科書の第9章「主成分分析」にのっている計算例を、自分でRにより実行してみることとする。 前半では、教科書の計算例の実行、後半では、Rのprcomp()関数を使うときに注意しなきゃなと思った点をメモしておく。 永田・棟近教科書の第9章「主成分分析」をRで実行してみる まず、データの入力。 > # データの入力 > > 生徒NO <- seq(1, 10, 1) > 国語 <- c(86,71,42,62,96,39,50,78,51,89) > 英語 <- c(79,75,43,58,97,33,53,66,44,92) > 数学 <- c(67,78,39,98,61,45,64,52,76,93) > 理科 <- c(68,84,44,95,63,50,72,47,72,91) データを確認のため表示させてみる。 > 成績d
R言語の入門者~中級者向けのページです。R言語の使い方を手とり足とり教えます!Rに初めて触れる方でも、分かりやすい構成にしてあります。また、Rによる代表的な統計解析を自作関数例を交えて紹介しています。リンクをクリックすると、各説明ページ(別ページ)に飛びます。 ※当サイトでは、”R言語”を、省略して”R”と記述することもあります。 ※当サイトで紹介しているプログラムはRでコピーアンドペーストすることで、実行が可能ですが、macのRの場合、書体(形式?)の問題でエラーすることがあるようです。その場合は、貼り付け時にcommand+alt+Vとすることで解消する場合があります。お困りの方はお試しください。ご迷惑おかけして申し訳ございません。 当ページについて これからR言語の勉強をしたいと考えている方、もしくは今すぐにでもRを使って解析をしたいと考えている方に向けたページです。R言語の初心者や
予測には過去のデータを使います。しかし、外れ値のような余計なデータまで使ってしまうと、予測精度が下がるかもしれません。 そこで「本当に予測に必要となる一部のデータ」だけを使います。 「本当に予測に必要となる一部のデータ」のことをサポートベクトルと呼び、サポートベクトルを用いた機械学習法がサポートベクトルマシン(Sapport vector machine:SVM)です。 ここでは、分類・回帰に分けたサポートベクトルマシンの概要と、R言語を用いた実装方法について説明します。 ソースコードはこちらに置いてあります。 スポンサードリンク 目次 サポートベクトル分類の考え方 マージン最大化とサポートベクトル ハードマージンとソフトマージン Rによる計算例:線形データ 非線形データへの対応とカーネル関数 Rによる計算例:非線形データ 補足:パラメタ推定の工夫とカーネルトリック サポートベクトル回帰の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く