連続変数をカテゴリー変数に変換する Last modified: Mar 28, 2006 連続変数をカテゴリー変数に変換するために使用するのは cut 関数である。オンライン・ヘルプで cut 関数を調べればたいていのことが片づく。 取っつきが悪いかも知れないので簡単な訳を付けておこう。 使用法: cut(x, breaks, labels=NULL, include.lowest=FALSE, right=TRUE, dig.lab=3) x 対象とする連続変数データの入っている数値ベクトル breaks 分割点を意味する複数の値で指定するか,いくつの区間に分割するかを意味する 1 個の値で指定する labels 分割されたデータはカテゴリー・データ(factor)になる。labels でカテゴリーに名前を付けることができる labels = FALSE とすれば,単に整数値で
美しい描画を行うためのパッケージとして有名なggplot2の仲間?にGGallyパッケージなるものがあるらしく、その中のggpairs関数を使うとふつくしいペアプロットが楽に作成できる。 できるのはいいんだが、この関数を使ってplotする際のフォントサイズ変更方法がググってもマニュアル読んでも出て来なかったのでメモっておく。 例のごとく、パッケージは install.packages("GGally") でインストールしておく。 肝心のフォントサイズの変更については、結論としてparams引数にlistとして入れればよく、各種フォントサイズについては size:散布図の点のサイズ(今回は使用してない) labelSize:各項目(列名)の文字サイズ corSize:相関値の文字サイズ と対応しており、これらを所望のサイズに設定してやればOKだ。*1 実際にPLOTしてみると以下のような感じ
Graph-to-Sequence Learning using Gated Graph Neural Networks. [ACL'18] 論文紹介Masayoshi Kondo
lsa: Latent Semantic Analysis The basic idea of latent semantic analysis (LSA) is, that text do have a higher order (=latent semantic) structure which, however, is obscured by word usage (e.g. through the use of synonyms or polysemy). By using conceptual indices that are derived statistically via a truncated singular value decomposition (a two-mode factor analysis) over a given document-term matri
Lancaster University This cheatsheet is an attempt to supply you with the key functions and manipulations of spatial vector and raster data. It does not have examples for you to cut and paste, its intention is to provoke the "Oh yes, that's how you do it" thought when stuck. library(sp) # vector data library(raster) # raster data library(rgdal) # input/output, projections library(rgeos) # geometry
2012年度統計数理研究所共同研究集会 「データ解析環境Rの整備と利用」 開催のお知らせ 2012年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。 日程:2012年11月29日(木)〜12月1日(土) 場所:統計数理研究所(東京都立川市)3階 セミナー室2(D304)ほか 参加費:無料 参加登録:不要 Program: ◯11月29、30日: 海外ゲスト講師によるチュートリアル講演 (英語) 場所:3階 セミナー室2 Speaker: Professor John Fox (Department of Sociology, McMaster University, Canada) 29 November (Thu.) 10:30〜12:00 : Structural Equation Modeling in
. . R † ‡ † ‡ COM-ONE 2011 1 24 1 / 63 1 2 3 4 5 2 / 63 R R R On memory 3 / 63 CRAN Task View: High-Performance and Parallel Computing with R (Dirk Eddelbuettel ) (Explicit parallelism) *,** (Implicit parallelism) *,**,*** (Grid computing) (Random numbers) *,** (Resource managers and batch schedulers) ** (Applications) * GPU (GPUs) (Large memory and out-of-memory data) * (Easier interfaces for Com
以前、三次元散布図をRで描いてみたという記事で紹介したRGLパッケージに画期的な新機能が加わったので紹介します。 (情報源:R: Interactive 3D WebGL plot of time-space cube with RGL | geolabs) RGLパッケージの良いところは、3次元プロットをマウスドラッグでグリグリ動かせるところなのですが、いざ、ファイル出力しようとすると、静止画か動画でしか保存できず、インタラクティブな3次元プロットをそのままファイルに保存することができないというのが欠点でした。 しかし今回、新機能として、WebGL で動く HTML ファイルとして保存できる機能が付加されたようです。 さっそく試してみましょう。 install.packages("rgl") library("rgl") data(trees) plot3d(trees) writeWe
手順距離関数Dist()で類似度を求め、hclust()でクラスタリングし、heatmap()のColv,Rowvオプションにdendrogram()を指定して出力する。プログラム例 library(amap) # Heatmapグラフ作成 # # ファイルの読み込み data <- read.table("test.txt", header=TRUE, row.names=1, sep="\t") # # PDFに出力する pdf() # # 距離関数で類似度のアルゴリズムとしてCosine係数を使用する # (method="pearson")は(1 - cosine)と同義である d1<-Dist(data, method="pearson") d2<-Dist(t(data), method="pearson") # # クラスタリングでAverage Linkageを使用する c
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く