エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
BigQueryでstring_aggを利用するときは結果の再現性に注意しよう - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
BigQueryでstring_aggを利用するときは結果の再現性に注意しよう - Qiita
概要 string_aggを利用した際に集計の再現性が取れずに詰まってしまったので、備忘のため掲載。 本題 st... 概要 string_aggを利用した際に集計の再現性が取れずに詰まってしまったので、備忘のため掲載。 本題 string_aggは文字列値を結合して返す集計関数である。 グループ集計で利用する場合は以下のように扱う。 select corpus, word_count, string_agg(distinct word) as word_set from `bigquery-public-data.samples.shakespeare` group by 1, 2 ただし上記の場合、実行ごとに結合する値の順序が異なる。 それによって、結果が再現できず、後続の処理があると問題が生じる場合もある。 そのため、結果の再現性を持たせるため、order byで結合順を指定すると良い。