S3 から BigQuery へ簡単にデータをロードする仕組み AWS x GCP で最適なシステムを作ろう! こんにちは。データエンジニアリンググループの川崎です。まだここにない出会いを求めて、日々コードを書いています。 この記事では、 S3 から BigQuery へデータをロードするときに使っている汎用的な仕組みについて紹介したいと思います。 なぜそんな仕組みが必要なの? 弊社では、日時のバックアップや外部の協働者とのデータの受け渡しのために AWS の S3 をよく使っています。 一方でデータの分析には Redshift や BigQuery を使っています。 そのため受け取ったデータを分析するには適宜ロードする必要があるのですが、そのロードの方法がバラバラだったため、いくつか管理上の問題がありました。 データを取り込む手法がバラバラでメンテナンスしづらい S3 のファイルを Bi
![S3 から BigQuery へ簡単にデータをロードする仕組み](https://cdn-ak-scissors.b.st-hatena.com/image/square/5b3cba4631c8084b7455e0e0989ddad65c17a0f4/height=288;version=1;width=512/https%3A%2F%2Fblog.recruit.co.jp%2Frls%2F2017-08-07-how-to-load-data-into-bigquer%2Fimg%2Farchitecture.jpg)