Rに関するshatoshan3のブックマーク (16)

  • foreachについてまとめたい - J's blog

    foreachパッケージのforeach関数についてです。 Rで並列処理を行う際に今まで使用してきましたが、引数は.combineをいじるくらいでした。他にも%dopar%とかよくわからないものを蔑ろにしていました。この関数は今後もよく使うことになりそうなので、頑張ってまとめてみたいと思います。 基形としてはこんな感じです。 foreach(i = 範囲) %do% { -- 処理 -- } 1~3の平方根の計算例が以下になります。返り値はデフォルトでlistです。 > foreach(i = 1:3) %do% { sqrt(i) } [[1]] [1] 1 [[2]] [1] 1.414214 [[3]] [1] 1.732051 イテレータをここではiとしていますが、もちろんaでもbでもokです。さらに言えば、イテレータは2つ以上あっても大丈夫で、その場合は要素数の少ない方に

    foreachについてまとめたい - J's blog
    shatoshan3
    shatoshan3 2018/10/23
  • Rで大量データを読み込む~read.csvとfreadを比較~

    導入 fread() はRで用いる関数で、.csv, .tsv などのテキストファイルから2次元のテーブル形式にデータを読み込みます。 同系統の関数read.table, read.csvより読み込み速度が早いメリットがあります。 data.table というパッケージに同梱されているので、インストール未完の場合は、先にインストールしましょう。

    Rで大量データを読み込む~read.csvとfreadを比較~
    shatoshan3
    shatoshan3 2018/10/23
  • オープンデータ取得先まとめ - Qiita

    2018/1/1時点で利用可能な、オープンデータの主要取得先を記載します。 1. 世界中の国や都市の情報 EUとイギリス Public Data EU http://publicdata.eu Open Data Europe http://data.europa.eu/euodp/en/home UK Government Data https://data.gov.uk アフリカ Africa Open Data https://africaopendata.org Code for South Africa http://code4sa.org Code for Africa https://codeforafrica.org アジア Open Cities Project http://www.opencitiesproject.org Open Nepal http://data

    オープンデータ取得先まとめ - Qiita
  • ブロックチェ-ンを構築しながら学ぶ | POSTD

    ブロックチェ-ンの仕組みを知るには構築するのが最短の方法 この記事を読んでいるということは、仮想通貨の拡大に興奮しているということですね。ブロックチェ-ンの仕組み、背後にある基的なテクノロジーについて知りたいのでしょう。 しかしブロックチェ-ンを理解するのは簡単ではありません。少なくとも私にはそうでした。大量の動画の中をさまよい、抜けだらけのチュートリアルに従い、結局、実例が少なすぎてフラストレーションが大きくなりました。 私は手を動かして学ぶのが好きです。コードのレベルで内容を扱わざるを得なくなり、そうすることで身に付くからです。同じようにやってもらえば、この解説が終わる頃には、機能するブロックチェーンが出来上がり、どのように動くかがしっかりと把握できるようになるでしょう。 準備 ブロックチェ-ンとはブロックという名の 不変でシーケンシャルな 一連のレコードだということを覚えてください

    ブロックチェ-ンを構築しながら学ぶ | POSTD
  • 機械学習におけるカーネル法について - めもめも

    何の話かというと 機械学習におけるカーネル法の説明で、よく登場するのがこちらの図です。 左側の (x, y) 平面上の点を分類する場合、このままだと線形分類器(直線で分類するアルゴリズム)ではうまく分類できないのが、右図のように z 軸を追加してデータを変形すると、平面できれいに分割できるようになって、線形分類器による分類がうまくいくというものです。このように、高次元空間にデータを埋め込むことでうまいこと分類するのがカーネル法の仕組みだというわけです。 なのですが・・・・・・・・・・・・・・・・・・・・ これ、当にカーネル法の原理を知っている方には、ちょっと気持ち悪くないですか? ※ 以下はカーネル法を知っている方向けのつぶやきです。 上記の例は、データの配置にあわせて、うまいこと z 軸方向の変形をしているのでうまくいっているのですが、カーネル法には、データの配置にあわせてうまいこと変

    機械学習におけるカーネル法について - めもめも
    shatoshan3
    shatoshan3 2017/10/13
  • Rでラベル付き散布図を作成して保存するまで - 503 Service Unavailable

    この程度のことだけれど意外に少し情報探すのにも苦労したのでメモ。散布図を書く場合、どの点がどの数値なのかのラベルが欲しい時がある。Rの場合、maptoolsパッケージを用いるとうまく出力できるのでその方法を紹介する。 データの準備 maptools関数*1を読み込んで、データを準備。*2 #今回使うライブラリ library(maptools) #データの準備 CC <- c("CAN","DNK","FIN","FRA","DEU","ITA","JPN","KOR","NLD","POL","SWE","GBR","USA") PAR <- c(13.7,15.7,16.6,16.6,20.2,20.1,22.1,10.3,14.9,13.5,17.6,15.6,12.8) SE <- c(3.8,7.4,8.6,11.5,8.5,12.2,9.3,1.9,5.4,8.9,9.4,6.

    Rでラベル付き散布図を作成して保存するまで - 503 Service Unavailable
    shatoshan3
    shatoshan3 2017/06/15
  • Rの対応分析でラベルの重なりを解消する - Memo plus Alpha

    はじめに Rで対応分析を行う場合、変数が多いとラベルが重複してしまう可能性があります。その場合、plot関数だけではうまく処理できません。 地道なやり方としてはメタファイルに出力して、Adobe Illustratorなどで処理することも可能ですが、ここではwordcloudライブラリを使った方法をメモしておきます(参考:wordcloud makes words less cloudy « Fells Stats)。 用意するもの R(できるだけ最新版を) MASSライブラリをインストール wordcloudライブラリをインストール 分析するデータ →ここでは次のデータ(部分抜粋。単語は38行あります。A~Eはジャンルだと考えてください)を処理します。 plotしてみる MASSライブラリを読み込み、corresp関数で対応分析を実行しplotします。 >library(MASS) >w

    Rの対応分析でラベルの重なりを解消する - Memo plus Alpha
    shatoshan3
    shatoshan3 2017/06/12
  • R 基本統計関数マニュアル

    shatoshan3
    shatoshan3 2017/06/11
  • 青木繁信氏:おしゃべりな部屋 (統計学ほか)

    アクセスしていただき,ありがとうございます。 このページへのアクセスは,通算 6265344 回目です。 (1995年8月31日 からカウント開始) フォト蔵ふ つれづれなるままに ときどき一枚 狛犬ギャラリー 道祖神ギャラリー

    青木繁信氏:おしゃべりな部屋 (統計学ほか)
  • R×MASS corresp関数のエラー対処方法 | トライフィールズ

    RのMASSパッケージ内のcorresp関数を用いたとき、エラーに悩まされたので、皆様と共有しておきます。 環境 Ubuntuのバージョン cat /etc/lsb-release DISTRIB_ID=Ubuntu DISTRIB_RELEASE=16.04 DISTRIB_CODENAME=xenial DISTRIB_DESCRIPTION="Ubuntu 16.04.2 LTS" Rのバージョン R --version R version 3.3.3 (2017-03-06) -- "Another Canoe" Copyright (C) 2017 The R Foundation for Statistical Computing Platform: x86_64-pc-linux-gnu (64-bit) R is free software and comes with A

    shatoshan3
    shatoshan3 2017/06/09
  • 対応分析のエラー empty row or column in table - リバネス研究日誌(らぼのーと)

    問題 対応分析を試みたところ、下記のようなエラーがでた > choco.ca=corresp(choco,nf=2) 以下にエラー corresp.matrix(as.matrix(x), ...) : empty row or column in table 対策 1行だけ、全部0の行があった。これを削除したところうまくいった。

    対応分析のエラー empty row or column in table - リバネス研究日誌(らぼのーと)
    shatoshan3
    shatoshan3 2017/06/09
  • R -- 数量化 III 類

    数量化 III 類     Last modified: Sep 01, 2009 目的 数量化 III 類を行う。 カテゴリーデータ行列の場合には,R の MASS ライブラリに入っている corresp 関数,または ca ライブラリに入っている ca 関数で全く同じ結果が得られる。 アイテムデータ行列の場合には,カテゴリーデータ行列に変換した後 corresp 関数,ca 関数を適用すればよい。 使用法 gt3(x) 引数 x データ行列(行がケース,列が変数) 要素が 0 または 1 のみからなるときはカテゴリーデータ行列 要素が 1 以上の整数値の場合にはアイテムデータ行列とみなす ソース インストールは,以下の 1 行をコピーし,R コンソールにペーストする source("http://aoki2.si.gunma-u.ac.jp/R/src/qt3.R", encoding

    shatoshan3
    shatoshan3 2017/06/09
  • 数量化 III 類

    数量化 III 類     Last modified: Nov 07, 2002 カテゴリーデータに基づき,ケースおよび変数の似通ったものをまとめる。 分析に使用する変数が間隔尺度以上の場合の主成分分析に相当する。コレスポンデンス分析あるいは双対尺度法によるものと同じ結果が得られる。 また,ダミー変数を用いた主成分分析と関連がある。 分析に用いるデータには 2 種類ある。 アイテムデータ 変数 $I_{i}\ ( i = 1, 2, \dots , p )$ が,それぞれ $m_{i}$ 個の選択肢を持つ。 各ケースは,表 1 に示すように,変数 $I_{i}$ の値として $1, 2, \dots , m_{i}$ の値を持つ。 このデータを,1 個のアイテム変数 $I_{i}$ を $m_{i}$ 個のカテゴリー変数( $C_{ij};\ i = 1, 2, \dots , p;\

    shatoshan3
    shatoshan3 2017/06/08
  • 数量化3類の概要と適用するデータ :: 【公式】株式会社アイスタット|統計分析研究所

    多変量解析の手法は、目的変数がある場合とない場合の二つに分けられます。目的変数のない場合の手法は、説明変数が数量データの場合とカテゴリーデータの場合の二つに分けられます。説明変数がカテゴリーデータの場合の手法は、数量化3類を適用します。 数量化3類は数多くある観察変数からいくつかの潜在変数を見出す手法です。その潜在変数における各サンプルの得点から、各サンプルの類似度を調べます。潜在変数を見出す関係式における観察変数のウエイトを用い、観察変数の類似度を調べます。数量化3類では、ウエイトをカテゴリースコア、サンプルの得点をサンプルスコアといいます。

    shatoshan3
    shatoshan3 2017/06/06
  • dplyrを使いこなす!基礎編 - Qiita

    はじめに 4月ということで、新卒が入ってきたりRを使ったことないメンバーがJOINしたりしたので、 超便利なdplyrの使い方を何回かに分けてまとめて行きます。 Rは知らないけど、SQLとか他のプログラミング言語はある程度やったことあるみたいな人向けです。 dplyrを使いこなす!シリーズ 基礎編以外も書きましたので、↓からどうぞ。 * dplyrを使いこなす!Window関数編 * dplyrを使いこなす!JOIN編 dplyrとは データフレームの操作に特化したパッケージです。 Rは基的に処理速度はあまり早くないですが、dplyrはC++で書かれているのでかなり高速に動作します。 ソースの可読性もよくなるので、宗教上の理由で禁止されている人以外は使うメリットは大きいです。 処理可能なデータサイズの目安 あくまでも個人の環境に強く依存した感覚値ですが、1000万行、100MBぐらいのデ

    dplyrを使いこなす!基礎編 - Qiita
    shatoshan3
    shatoshan3 2017/06/05
  • 『Rによるデータサイエンス』をcaretで再現する - Qiita

    『Rによるデータサイエンス-データ解析の基礎から最新手法まで』 にある各実行をRのcaretパッケージで試します。 対象外 caretは教師あり学習の判別と予測がメインなので、教師なし学習や生存分析、時系列モデルなどは対象外。 対象外:第1-6章、第11-12章、第17章 全体のメモ lmなど通常の関数で作成したモデルに対応するcaret使用のモデルは $finalModel となる。 ただ一部項目は異なるようです。 例 lm cars.lm<-lm(dist ~ speed, data = cars) cars.caret.lm<-train(dist ~ speed, data = cars, method = 'lm') cars.lm に対応するのは cars.caret.lm$finalModel 予想結果等は一致する モデルの統計値等の項目が異なる場合があるので、図示や統計値抽

    『Rによるデータサイエンス』をcaretで再現する - Qiita
    shatoshan3
    shatoshan3 2017/05/30
  • 1