
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【BigQuery】正規表現を使ってURLを分解する - ドメイン名|パス(path)|utmパラメータ - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【BigQuery】正規表現を使ってURLを分解する - ドメイン名|パス(path)|utmパラメータ - Qiita
背景 BigQueryでURLを分解したい!そんな時、ありますよね。 仕事で使う都合上色々と調べていたのですが... 背景 BigQueryでURLを分解したい!そんな時、ありますよね。 仕事で使う都合上色々と調べていたのですが、自分が欲しい粒度でまとまっているものがなかったので自分で書いてみました。その結果を共有します! まず、前提としてBigQueryにはURLを分解する関数が存在しないため、正規表現を用いて行う必要があります。 今回はBigQuery上でURLの下記部分の抽出方法を書いていきたいと思います。 FQDN(ホスト名+ドメイン名) path utmパラメータ各種 パラメータ部分全て 使用する関数 今回使用する関数は『 REGEXP_EXTRACT 』。 正規表現部分(regexp)と一致するvalue内の最初の文字列を返して、一致部分がないときはNULLを返す関数です。position部分に正の整数を入れると、最初の文字列以外を指定することもできます。 正規表現内にキャプチャグループ()が