タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

HadoopとSqoopに関するnobusueのブックマーク (1)

  • Sqoopメモ(Hishidama's Apache Sqoop Memo)

    概要 インストール [/2012-06-19] 使用例 MySQL [/2012-06-01] PostgreSQL [/2012-06-01] Oracle [/2012-06-22] 使用上の注意 [2012-05-12] Sqoopの内部(ソース) [/2012-07-07] 概要 Sqoopは、RDBとHDFS間でデータ転送を行うツール。 2012/4/2にApacheのincubatorプロジェクトからトップレベルプロジェクトに昇格した。 データ転送はMapタスクのみのMapReduceで並列して分散実行される。 RDBへのアクセスはJDBC経由。 テーブル定義もRDBから読み込んでくれる。 import RDBのテーブルを読み込んでHDFS上のファイルに出力する。 差分だけ取り込む事も出来る(merge)。ただし削除は出来ない。 export HDFS上のファイルを読み込んでR

  • 1