タグ

SQLとBigQueryに関するmisshikiのブックマーク (6)

  • データモデリングでよく利用するBigQuery SQLのクエリパターン

    記事は、データ推進室 Advent Calendar 2024 24日目の記事です はじめに こんにちは。HR領域でアナリティクスエンジニアのテックリードをしている山家雄介です。 アナリティクスエンジニアが担当する業務の一つに、データ利用者向けのいわゆるデータマートの設計・開発があります。これは、さまざまな仕様のデータソースを適切に組み合わせて、データ利用者の業務上の目的を達成することを助ける、平易に理解しやすく、ドキュメントも整備されたテーブル群を設計・開発し提供していく営みです。この業務を首尾よく進めていくには、dbtやDataformといったデータモデリングのツールの機能性を深く理解すると同時に、利用しているデータ分析基盤のSQLの仕様や機能性もよく理解しておく必要があります。 同じSQLという言語仕様の中でも、データマートの利用者によく利用される機能性と、それを開発するデータモデ

    データモデリングでよく利用するBigQuery SQLのクエリパターン
    misshiki
    misshiki 2025/03/13
    “データモデリングでよく利用するクエリのパターンをカテゴリ別にご紹介します。”
  • BigQuery Studio は何者なのか

    はじめに こんにちは、クラウドエース データ ML ディビジョン所属の工藤です。 クラウドエースの IT エンジニアリングを担うシステム開発部の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのがデータ ML ディビジョンです。 データ ML ディビジョンでは活動の一環として、毎週 Google Cloud の新規リリースを調査・発表し、データ領域のプロダクトのキャッチアップをしています。その中でも重要と考えるリリースをページ含め記事として公開しています。 今回紹介するリリースは、BigQuery Studio です。BigQuery Studio の登場により、BigQuery 上で Python ノートブック環境が使えるようになりました。Duet AI によるコード補完もサポートしていますので、非エンジニアの方もデータ分析しやすい環境

    BigQuery Studio は何者なのか
    misshiki
    misshiki 2023/10/31
    “BigQuery Studio は、従来のデータ分析に関する機能や他プロダクトとの連携機能などに、Python ノートブック環境の利用や Duet AI によるコード補完などの新機能を伴って刷新された、BigQuery の機能の総称です。”
  • Google CloudのDataformでBigQueryにテーブルを作成してみた | DevelopersIO

    DataformでBigQueryにテーブル・ビュー・マテリアライズドビューを作成してみました。テーブルとカラムに説明をつけるための設定も確認しました。 データアナリティクス事業部の鈴木です。 Google CloudのDataformでBigQueryにテーブルを作成してみたので、試したことをまとめました。 Dataformは記事執筆時点ではプレビュー版で、この記事もプレビュー版について記載しています。先立って試してみたい方の参考になりましたら幸いです。 Dataformとは SQLを使用してBigQueryでスケーラブルなデータ変換パイプラインを開発・運用できるサービスです。 製品紹介ページは以下になります。 主な機能として、以下の3点が紹介されています。 データ変換を管理するためのオープンソースのSQLベースの言語:Overview of Dataform coreに記載があります

    Google CloudのDataformでBigQueryにテーブルを作成してみた | DevelopersIO
    misshiki
    misshiki 2023/04/18
    “Dataformとは SQLを使用してBigQueryでスケーラブルなデータ変換パイプラインを開発・運用できるサービス”
  • Introducing the Data Validation Tool

    The latest news from Google on open source releases, major projects, events, and outreach programs for early career developers. Data validation is a crucial step in data warehouse, database, or data lake migration projects. It involves comparing structured or semi-structured data from the source and target tables and verifying that they match after each migration step (e.g data and schema migratio

    Introducing the Data Validation Tool
    misshiki
    misshiki 2021/08/12
    “データ検証ツール(DVT)を発表しました。これは、さまざまな環境で検証するための自動化された反復可能なソリューションを提供するオープンソースのPython CLIツールです。”
  • 論理プログラミング言語Logicaでデータサイエンス100本ノック

    Googleが発表したOSSプロジェクトである論理プログラミング言語Logicaを使って、データサイエンス100ノック(構造化データ加工編)の設問を解きながらどのような言語かを確認していく。 (BigQueryのクエリとして実行していく) 最初に、プログラミング言語Logicaの特徴を纏めておく。 論理型プログラミング言語: このカテゴリではPrologが有名 SQLにコンパイルされる: 現状BigQueryとPostgreSQLに対応 モジュール機構がある: SQLと比較した強み コンパイラはPythonで書かれている: Jupyter NotebookやGoogle Colabですぐ始められる Colabでチュートリアルが用意されているので、まずこちらからやると良いと思う。 コードの見た目は関係論理の記述に似ている。 事前に、データサイエンス100ノックのテーブルデータをBigQu

    misshiki
    misshiki 2021/06/28
    “論理プログラミング言語Logicaを使って、データサイエンス100本ノック(構造化データ加工編)の設問を解きながらどのような言語かを確認していく。 (BigQueryのクエリとして実行していく)”
  • Logica

    Logica is an open source declarative logic programming language for data manipulation. Logica extends syntax of logic programming for intuitive and efficient data manipulation. It compiles to SQL thus providing you access to the power of SQL engines with the convenience of logic programming syntax. Logica can compiles to SQL dialects of DuckDB, SQLite, Google BigQuery and Postgres. This makes it p

    Logica
    misshiki
    misshiki 2021/06/28
    “Logicaは、データ操作用のオープンソースの宣言型論理プログラミング言語です。Logicaは、以前Googleで作成された言語であるYedalogの後継 です。”
  • 1