#今回は知財ではなく純粋にITの話です。なお、SoftbankのCMとも関係ありません。 データウェアハウスを構築する上で重要な処理にETL(Extract Transformation Load)があります。文字通り、データソースのシステムからデータを「抽出」し、「変換」し、データウェアハウスに「ロード」する処理のことです。 「変換」処理では、複数ソースのデータを統合して、データの形式をそろえたり、不正データを排除したりします。いわゆるデータ・クレンジング(洗浄)と呼ばれる処理です。これによってデータウェアハウスにロードされるデータの品質を向上できます。 しかし、ビッグデータの世界ではこのデータ洗浄をしてからロードするという考え方が必ずしも適切ではなくなってきます。データ品質とは一義的に決まるものではなく、分析の文脈によって変わってくるからです。データ管理者ではなくデータサイエンティスト
![ETLよりもELTが大事になってくることを納得できる例 | 栗原潔のIT弁理士日記](https://cdn-ak-scissors.b.st-hatena.com/image/square/777daf6eac3ba8b0e38d538708a1ae07a4b3b2e4/height=288;version=1;width=512/https%3A%2F%2Ftechvisor.jp%2Fblog%2Fwp-includes%2Fimages%2Fkurihara_at_desk.jpg)