以下のvignetteの内容に沿っているが一部順序は前後している。 http://cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html dplyrパッケージとは Hadley Wickhamが作成したデータ操作に特化したRのパッケージ。 彼がこれまでに作成した有名なRパッケージにはggplot2やplyr、reshape2などがある。 Rという統計に特化したDSLの中にさらに自分の価値観を反映したDSLを作り上げている様はまさにHadley Universe。 使うメリット データ操作に特化したパッケージとしては同作者のplyrがあった。 しかしplyrは便利だが全てRで書かれておりとにかく遅い。 dplyrはC++で書かれており、無駄な関数呼び出しがないので速い。 どのくらい速いかはこちらを見てほしい。 http:
小ネタです。まとめって程でも無いので"簡易メモ"としました。 RDS(PostgreSQL)に於けるデータのインポートやエクスポート、またはRDS(PostgreSQL)とAmazon Redshift間に於けるデータ連携について情報を整理しておく機会がありましたので、簡単にではありますが当エントリにその内容をまとめてみました。 RDS(PostgreSQL)とAmazon Redshiftの関係性 以下ドキュメントに記載があるように、Amazon RedshiftはPostgreSQL8.0.2に準拠した形になっています。PostgreSQLで使っていた大抵のSQL文は利用出来ますが、場合によっては使えなかったり、使い方が異なっていたりしますので注意が必要です。 Amazon Redshift および PostgreSQL - Amazon Redshift RDS(PostgreSQL
Amazon RDS に移動させる既存の PostgreSQL デプロイがあるとします。タスクの複雑さは、データベースのサイズと転送するデータベースオブジェクトの種類に依存しています。例えば、データベースにギガバイトのオーダーのデータセット、さらにストアドプロシージャとトリガーが含まれているとします。このようなデータベースは、単純なデータベース (数メガバイトのテストデータを含むだけで、トリガーやストアドプロシージャを含まないもの) よりも複雑になります。 次の条件で、ネイティブ PostgreSQL データベース移行ツールを使用することをお勧めします。 ターゲットデータベースエンジンと同じデータベースエンジンを持つデータベースから移行する、同機種移行である。 データベース全体を移行する。 ネイティブツールでは、最小のダウンタイムでシステムを移行することができます。 他の多くの場合、データ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く