この記事は CrowdWorks Advent Calendar 2017 20日目の記事です。 はじめに クラウドワークスでエンジニアをしている @yosu と @ToruIwashita です。 普段は主にCrowdWorksのアプリケーション基盤に関わる開発を行っています。 そんな中で最近、短期間で大量なデータを対象に複雑なデータ分析を行う必要がありました。 その際、普段のデータ分析では行わないような試行錯誤を経験したため、この記事ではそのとき起きたことを書いていきたいと思います。 背景 CrowdWorksではデータベースとしてMySQLを利用し、そのテーブル数は400超、総レコード数は数億あります。 このうち一部のデータはRedshiftに同期されていて、普段カジュアルにデータ分析したい場合はRedashを通してクエリを実行し、グラフ化、ダッシュボードの作成を行っています。 クラ