このエントリでは、Mac上でhdfsにmysqlからデータをロードする手順を記載します。 sqoopを利用する手順とembulkを利用する手順を示します。 Apache Sqoop: http://sqoop.apache.org/ embulk: https://github.com/embulk/embulk この手順の前提として、 homebrew及びjdk, hadoop, hdfsのセットアップは完了し、hdfsのnamendeは起動しているものとします。 hadoopとhdfsのセットアップについては、 以下エントリの「Hadoopとhdfsのセットアップ」を参考にしてください。 Mac上でのhiveセットアップ手順(mysql上にmetastoreを作成): http://takemikami.com/2016/04/20/Machivemysqlmetastore.html
![hdfsにsqoopとembulkでmysqlからロードする手順 | takemikami's note](https://cdn-ak-scissors.b.st-hatena.com/image/square/3636be88632f7735c117b6acb9fd3380614b1902/height=288;version=1;width=512/https%3A%2F%2Ftakemikami.com%2Fimages%2Fcommon%2Ftakemikamisnote-logo-s.png)