タグ

ProgrammingとRに関するagwのブックマーク (82)

  • 統計解析向けのプログラミング言語「R言語」の魅力と汎用言語との違い

    こんにちは。NECラーニングの山崎と申します。今回は、ビッグデータに興味がある技術者の方であれば一度は耳にしたことがあるR言語の概要とその魅力を、弊社の名物インストラクターである横垣と米倉にインタビューしながらご紹介していきます。 R言語は技術者の皆様がよく使われる、C言語やJavaPHP、などの汎用開発言語ではなく、統計解析言語です。よって、R言語の勉強を始めたときに汎用言語を習得してきた人は戸惑うことが多いと思います。R言語は統計解析言語ですので、技術的な背景以外にも基礎的な統計学の知識も必要となります。もしかしたら統計学と聞いて、専門外と考え毛嫌いしてしまう人もいらっしゃるかもしれませんが、あくまで基礎的な統計学の知識が必要なレベルであり、弊社がご提供しているビッグデータ概説(1日コース)を受講いただくだけでも十分習得できるレベルです。 また、昨今の市場の流れを見てくと、ビッグデー

    統計解析向けのプログラミング言語「R言語」の魅力と汎用言語との違い
  • sfchaos on Twitter: "カリフォルニア大学デービス校のNorm Matloff先生が,Rにおける並列計算の書籍のドラフトを公開している.ループ処理の並列化, メッセージパッシング, 共有メモリ,GPGPU,線形代数演算の並列化などの話題が取り上げられている. http://t.co/JhGAswrUxT"

  • パッケージユーザーのための機械学習(1):決定木 - 渋谷駅前で働くデータサイエンティストのブログ

    (※はてなフォトライフの不具合で正しくない順番で画像が表示されている可能性があります) だいぶ前に「糞コードで頑張る機械学習シリーズ」と言うのを始めようとしたんですが、パーセプトロンをPythonで実装した次にMatlabで書いたSMO-SVMコードをPythonに移植しようと思っているうちに時間が過ぎ。。。 あまつさえ転職したら、今の現場にはライブラリ皆無でほぼ全ての機械学習のコードをPython / Java / C++のどれでも書ける化け物^H^H「教授」がいてそんなこと僕がやる必要性は完全になくなってしまったのでした(笑)。 ということで、カテゴリ名はそのまま*1ながら方向性を変えて、僕のようなパッケージやライブラリに依存するユーザーが機械学習を実践する際に原理上のどのような点に気を付けて実装・実践すべきかを、僕自身の備忘録のためにだらだらと書いていくシリーズにしてみようと思います

    パッケージユーザーのための機械学習(1):決定木 - 渋谷駅前で働くデータサイエンティストのブログ
  • ESS - RjpWiki

    RjpWiki ¤Ï¥ª¡¼¥×¥ó¥½¡¼¥¹¤ÎÅý·×²òÀÏ¥·¥¹¥Æ¥à R ¤Ë´Ø¤¹¤ë¾ðÊó¸ò´¹¤òÌÜŪ¤È¤·¤¿ Wiki ¤Ç¤¹Emacs ¤«¤é R ¤ò»È¤¦ † ESS (Emacs Speaks Statistics) ¤Ï Emacs ¤ä XEmacs ¤«¤é R ¤Ê¤É¤ÎÅý·×²òÀÏ¥¢¥×¥ê¥±¡¼¥·¥ç¥ó¤òÊØÍø¤Ë»È¤Ã¤Æ¤·¤Þ¤ª¤¦¡¤¤È¤¤¤¦ Lisp ¥×¥í¥°¥é¥à¤Ç¤¹¡¥¡Ê¥¹¥¯¥ê¡¼¥ó¥·¥ç¥Ã¥È¡Ë ESS¤¬¤É¤ì¤À¤±¤ìǽΨ¸þ¾å¤ò¤â¤¿¤é¤·¤Æ¤¯¤ì¤ë¤â¤Î¤«¡¢¤Ê¤É¤Ï¡ÖThe R Book¡×p.55--56¤Ë½ö½Ò¤µ¤ì¤Æ¤¤¤Þ¤¹¡£ ↑ News † ºÇ¿·ÈÇ¡§5.3.9 update!¡¡(200

  • 統計グラフの色

    [TODO] R 4.0.0 以降の色についてはそのうち書きます。とりあえず palette() のヘルプをご覧ください。palette("Okabe-Ito") とするとsafe colorsになります。→ A New palette() for R,Color Universal Design,Essentials of color in R。あと Colorspace 2.0 とその JSS paper。 はじめに 統計グラフに色を付けることは広く行われています。しかし,色は万人に共通のものではありません。日人男性の5%,白人男性の8%は,RGB(赤緑青)のうち赤と緑の区別がうまくできません。その内訳は1:3で赤の感受性がないP型(1型,protanopia)と緑の感受性がないD型(2型,deuteranopia)に分かれます。青を感じない人や,RGBのうち2色以上を感じない人もい

  • R言語で統計解析入門: 散布図によるデータの視覚化 梶山 喜一郎

    R言語で統計解析入門: 散布図によるデータの視覚化 梶山 喜一郎
  • 28. 演算子 - R-Source

    x == y , x != y など,演算子による比較は,x, y が異なったタイプである場合や長さが異なる場合に不具合が生じる場合がある.二つのオブジェクトが『殆んど等しいか』どうかをチェックする場合は,関数 identical() と関数 all.equal() を組み合わせた方法が確実である.『殆んど等しい』の意味はオブジェクトの種類により異なるが,数値ベクトルの場合は誤差の範囲内で一致するかどうかを判断する. identical(1, 1.) # R では 1 と 1.0 はともに倍精度実数で表現 [1] TRUE identical(1, as.integer(1)) # as.integer(1) は整数型なので FALSE になる [1] FALSE x <- 1; y <- 1.0; z <- 1.00000001; if (x == y) # 数値誤差を考慮に入れない等号

    agw
    agw 2014/01/11
    ベクトル同士の論理和を取る
  • 48. とりあえず plot() - R-Source

    とりあえずplot() R で一番良く使われる高水準作図関数が関数 plot() である.最も基的で機能も多い関数も plot() である.この関数を使って散布図や折れ線グラフなどを描くことが出来る. 例えばデータが入っているベクトル x ,y を点の座標として以下の様に入力する.すると散布図の出力が得られる.プロット範囲は引数 xlim, ylim で決めることが出来る. x <- 1:10 y <- 1:10 # plot(x 軸のデータ, y 軸のデータ, オプション) plot(x, y) # 範囲は自動で決まる(xlim=c(1,10)を指定した場合と同じ) plot(x, y, xlim=c(10,1)) # x 軸の正の向きを左向きにすることも出来る

  • 43. データの結合(マージ)と整列(ソート) - R-Source

    x と y を併合(マージ)する.通常は引数に all=T を指定し,データを全て残す.all=T を指定しなければデータの共通部分が結果として返される. id <- c("A","C","E") height <- c(158,177,166) D1 <- data.frame(ID=id, H=height) id <- c("A","B","D","E") weight <- c( 51, 55, 57, 55) D2 <- data.frame(ID=id, W=weight)

  • 44. データの加工と抽出 - R-Source

    論理ベクトルが TRUE となっている行にのみアクセスする.例えば x[sapply(x, is.numeric)] ならば数値データにのみアクセスする.

    agw
    agw 2014/01/11
    幅広いデータの取得方法を紹介。
  • 日付、時間関数Tips大全 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です日付・時間関数Tips大全 Rには日付(date)オブジェクトを表すクラス "Date" と,日付時分秒(date-time)オブジェクトを 表すクラス "POSIXlt", "POSIXct" がある. クラス "Date" † クラス "Date" は date オブジェクト(年月日)を表し,1970-01-01 以来の 経過日数(負の値は過去に遡る)で表現される.内部的には実数で表現されるが,表示の 際は整数値とされる.日数との加減算,比較演算が可能である. format(), plot(), hist(), seq(), cut(), round() 関数は "Date" クラス用のメソッド関数を持つ.as.Date() は数値を "Date" オブジェクトに 変換する.weekda

    agw
    agw 2014/01/11
    POSIXct、POSIXltの存在を知った。
  • Sign in - Google Accounts

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

    agw
    agw 2014/01/11
    因子型データの説明が分かりやすい。
  • 25. データ型とデータ構造 - R-Source

    x <- c(1, 0, 1, 0, 1) mode(x) [1] "numeric" mode(x) <- "complex" # storage.mode(x) <- "complex" でも可 x [1] 1+0i 0+0i 1+0i 0+0i 1+0i mode(x) <- "logical" x [1] TRUE FALSE TRUE FALSE TRUE ベクトルの型の間には以下の大小関係がある. character > complex > numeric > logical > NULL ベクトルの要素は全て同じ型なので,異なった型のデータを集めてベクトルを作ろうとすると上記の変換規則によって『最も大きい』型に揃えられる.また,実数と論理数の間は自動的に変換がなされる.例えば,演算式中に実数値が期待されている時に論理値が表れると以下のように計算される. TRUE  → 1 ,

    agw
    agw 2014/01/11
    as.character()を調べたときに訪れた。
  • 16. 種々のベクトル - R-Source

    ベクトルの要素には実数以外を用いることも出来る. 複素型ベクトル 複素型ベクトルは複素数を要素とするベクトルのことである.実部と虚部をベクトルで指定したり,絶対値と偏角を指定することでも複素型ベクトルを作ることが出来る. c(1+1i, 2+3i) # 虚数 1+i を表すときは 1+1i と表記する [1] 1+1i 2+3i # 1+i とすると i は変数と認識される complex(re=1:3, im=4:6) # re :実部 ,im :虚部 [1] 1+4i 2+5i 3+6i complex(mod=c(1,2), arg=c(0, pi)) # mod:絶対値,arg:偏角 [1] 1+0.000000e+00i -2+2.449213e-16i ベクトルの要素中に 1 つでも複素数が見つかれば要素全体が複素数となる. 複素数を要素にもつベクトル z を処理する場合は,実

    agw
    agw 2014/01/11
    因子型について。
  • R:read.csv / read.tableで型と列名を指定して読み込む。 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

    R:read.csv / read.tableで型と列名を指定して読み込む。 - Qiita
  • 19. 行列の作成 - R-Source

    行列の作成 R では以下の手順で行列を作成する. 行列の要素をベクトル(配列やリスト,行列でも可)で用意する 関数 matrix(ベクトル, 行数, 列数) でベクトルから行列に変換する 例として,ベクトル (1,2,3,4,5,6) を変換して,行列 を作成する. matrix(1:6, nrow=2, ncol=3) # nrow で行数,ncol で列数を指定する # matrix(1:6, 2, 3) と略記しても良い [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 R での行列とは行と列を持つ 2 次元配列を指す.数学の世界の行列は各要素が数値となっている行列しか扱わないだろうが,R の行列は 2 次元配列なので論理値や文字列などを要素とする行列を作成することも出来る.よって,配列を生成しているという意味で関数 array() を用いても作成することが出

  • Sign in - Google Accounts

  • ror平台搜索官网

    2021年8月1日ror搜索是全球最大、最快、最全的BC搜索引擎,采用先进的极速算法v9浏览器引擎,最完善的浏览加密技术,让安全不在成为你的烦恼,2021年7月10日 官网正式发布1.0.0,立即体验ror搜索2021年8月1日ror搜索是全球最大、最快、最全的BC搜索引擎,采用先进的极速算法v9浏览器引擎,最完善的浏览加密技术,让安全不在成为你的烦恼,2021年7月10日 官网正式发布1.0.0,立即体验ror搜索

  • Rで統計: *.Rソースファイルの読み込みと実行 – source()関数

    これまでの例は数行のコマンドでしたのでプロンプトに直接を打っていましたが、何十行というロジックをプロンプトに順々に打っていくのは非効率です。今回は、予め外部のテキストファイルにソースコードを書き、そのファイルをプロンプトから呼び出す手順を次の例で示します。 以下のソースコードを拡張子Rのテキストファイルで保存し、プロンプトから読み込んで実行してみましょう。 test.R batting2007 <- c(193, 204, 172, 177, 175, 155, 122, 118, 120, 139) print(batting2007) このテキストファイルを作業ディレクトリにおきます。なお、作業ディレクトリの設定方法はこちらをご覧ください。→作業ディレクトリの設定と確認 - setwd()、getwd()関数 プロンプト > source("test.R") [1] 193 204 1

    Rで統計: *.Rソースファイルの読み込みと実行 – source()関数
    agw
    agw 2013/12/28
    sourceとsummary。
  • Rをコマンドラインで実行する

    Rをコマンドラインから(バッチ処理として)実行できると、例えば、マルチコアのコンピュータシステム上で複数の計算を並列して実行することができるなどのメリットがある。なお、並列計算のためには、このページだけでなく、Rをコマンドラインで実行する(時間を要する計算、並列計算の実行)も参考にするとよい。 ここでは、Rスクリプトをコマンドラインから実行するための方法を紹介する。 まずは、次のようなRスクリプトを考える。 # drawHisto.R data <- read.csv("rnorm.csv", row.names = 1) # rnormを読み込む pdf("rnorm_histo.pdf") # pdfファイルとしてグラフを出力する準備 hist(data$x) # 読み込んだデータのヒストグラムを出力する dev.off() # pdfファイルを閉じる このスクリプトをRのエディ