最近、bigqueryの評価を行っている。本番向けのデータではよくあることだが、本来データが入る場所にnullが入っていたり、要素が無かったり、逆に要素が多かったりする。 bigqueryはTreasureDataの様にスキーマレスではなくきちんとスキーマを定義しなければならない。 bigqueryでは、スキーマの定義にjsonを使い、データのロードにもjsonを使うため、要素にミスマッチが発生する場合が考えられる。 スキーマとjsonで要素のミスマッチがあった場合は、データにnullが入っていた場合のbigqueryの挙動に関してまとめた。 最初に結果だけ書き、後半に実際にデータロードで試したサンプルを乗せる。 データロード時のBigQueryスキーマと、jsonの対応 送信jsonにスキーマがある。 送信jsonにスキーマが無い
![BigQueryでデータロード時に欠損値の読み込みルールまとめ - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/ac4d315bc244ed040138755c0e652f5469b367b2/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9QmlnUXVlcnklRTMlODElQTclRTMlODMlODclRTMlODMlQkMlRTMlODIlQkYlRTMlODMlQUQlRTMlODMlQkMlRTMlODMlODklRTYlOTklODIlRTMlODElQUIlRTYlQUMlQTAlRTYlOTAlOEQlRTUlODAlQTQlRTMlODElQUUlRTglQUElQUQlRTMlODElQkYlRTglQkUlQkMlRTMlODElQkYlRTMlODMlQUIlRTMlODMlQkMlRTMlODMlQUIlRTMlODElQkUlRTMlODElQTglRTMlODIlODEmdHh0LWFsaWduPWxlZnQlMkN0b3AmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZzPTg3MjU5ODlkZDU4MGUzMzg2OTBiMThmZTUwMDNhZWFi%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBzaGliYWNvdyZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9OTAyM2U0MGQzZmE1YjA5YTk1NjZiZGQ3OTk5NWNiMzE%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3Dce46b8b20a6e50ba56d8dad63e9fe8a9)