タグ

BigQueryに関するmisshikiのブックマーク (97)

  • DuckDBとTaskfileで作るBQ×スプレッドシートの使い捨てEDA環境 - エムスリーテックブログ

    こんにちは。AI機械学習チームの高田です。 他部署からスプレッドシートでデータを受け取って、社内のDWHにあるデータと突き合わせながら探索的に分析したい。こういう場面で毎回環境構築するのは手間なので、さっと始められるEDA環境がほしいと思っていました。DuckDB + Taskfileの組み合わせがちょうどよかったので紹介したいと思います。 DuckDBが解決すること BQ + GSSを1つのSQLで横断する なぜBQ側からGSSを直接読まないのか ローカルキャッシュで高速化 & BQ課金ゼロ 出力の柔軟性 Taskfileで組む軽量ワークフロー なぜTaskfileか サンプルプロジェクトを作ってみた BQからデータを取得してParquetに保存する GSSの作品リストとBQの単語データをJOINして集計する Taskfile.ymlの構成 キャッシュ戦略をTaskfileで実装する

    DuckDBとTaskfileで作るBQ×スプレッドシートの使い捨てEDA環境 - エムスリーテックブログ
    misshiki
    misshiki 2026/04/09
    DuckDB と Taskfile で、BigQuery と Google Sheets を横断する使い捨て EDA 環境を構築する話。BigQuery は Parquet にローカルキャッシュして課金と待ち時間を削減し、Taskfile の sources/generates で再取得を自動制御する。
  • 社員に何もさせずにClaude Code利用ログを集める ── 数百名規模のOpenTelemetry収集基盤の構築 - ZOZO TECH BLOG

    こんにちは、技術戦略部CTOブロックの塩崎です。 当社ZOZOには1人あたり月額200ドルの基準のもと、Claude CodeやGemini CLIをはじめとした各種AI開発ツールを利用可能にする制度を2025年7月にスタートさせました。 corp.zozo.com 現在ではこの制度を用いて数百名という非常に多くの社員がClaude Codeを利用しています。このような中で組織全体のAI活用を推進するためには、それぞれの社員や部署のClaude Codeの利用状況をモニタリングすることが重要です。そのためにClaude CodeのOpenTelemetry機能を利用して、全社員のClaude Code利用状況を収集したので、記事ではその手法を紹介します。 ccusageを使った利用情報の収集の課題 Claude CodeのOTel機能の紹介 作ったものの全体像紹介 利用情報を送信する部分

    社員に何もさせずにClaude Code利用ログを集める ── 数百名規模のOpenTelemetry収集基盤の構築 - ZOZO TECH BLOG
    misshiki
    misshiki 2026/03/13
    ZOZOがClaude CodeのOpenTelemetry機能で数百名規模の利用ログ収集基盤を構築。Intuneで設定を自動配布し、Cloud Run→Cloud Logging→BigQueryで分析。ccusageの手動回収を避け、組織別利用状況やコスト最適化に活用。
  • BigQuery AI関数だけでRAGを構築する ― Embedding生成から類似検索まで

    はじめに BigQuery の AI 関数(AI.EMBED・AI.SIMILARITY・VECTOR_SEARCH)を使えば、外部のベクトルDBや追加インフラなしで RAG(Retrieval-Augmented Generation)を構築できます。 以前は CREATE MODEL でリモートモデルを登録し、ML.GENERATE_EMBEDDING や ML.DISTANCE で処理する必要がありましたが、現在は AI 関数に移行され、よりシンプルに扱えるようになりました。 旧(ML関数) 新(AI関数) 変更点

    BigQuery AI関数だけでRAGを構築する ― Embedding生成から類似検索まで
    misshiki
    misshiki 2026/03/12
    BigQueryのAI.EMBED・AI.SIMILARITY・VECTOR_SEARCHで、外部ベクトルDBなしにRAGを構築する手順を解説。Vertex AI接続とSQLだけでEmbedding生成から類似検索まで実装可能。CREATE MODEL 不要で従来より簡単。
  • BigQuery の会話型分析のご紹介 | Google Cloud 公式ブログ

    Try Nano Banana 2State-of-the-art image generation and editing Try now ※この投稿は米国時間 2026 年 1 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。 企業はすばやく行動し、情報に基づいた意思決定を行いたいと考えていますが、昨今の組織ではデータが爆発的に増加しているため、ナレッジチームが作業に忙殺され、ビジネス ユーザーは必要なデータ分析情報を得るために長い順番待ちをすることがよくあります。AI エージェントは、この関係を根的に変え、ユーザーがデータから行動へとより迅速に移行できるようになります。 Google はこのたび、BigQuery の会話型分析(プレビュー版)を発表いたします。この新しいサービスにより、ユーザーは自然言語を使用してデータを分析できるようになり、長らく当

    BigQuery の会話型分析のご紹介 | Google Cloud 公式ブログ
    misshiki
    misshiki 2026/02/26
    BigQueryに会話型分析を追加(プレビュー)。自然言語質問に対し多段階処理で回答を生成。要約、元データ結果、可視化を含む包括的分析を対話形式で実現。
  • BigQuery AI: Gemini 3.0 対応、エンベディング生成の簡素化、新しい類似度関数 | Google Cloud 公式ブログ

    Try Gemini 3.1 ProOur most intelligent model available yet for complex tasks on Gemini Enterprise and Vertex AI Try now ※この投稿は米国時間 2026 年 1 月 27 日に、Google Cloud blog に投稿されたものの抄訳です。 デジタル環境には、画像、動画、音声、ドキュメントなどの非構造化データが溢れており、多くの場合、これらは活用されていません。このデータの可能性を最小限の摩擦で活用できるよう、Google は Gemini  やその他の Vertex AI モデルを BigQuery に直接統合しました。これにより、BigQuery SQL を使用して生成 AI やエンベディング モデルを簡単に操作できます。この分野での新たなリリースにより、設定がさらに

    BigQuery AI: Gemini 3.0 対応、エンベディング生成の簡素化、新しい類似度関数 | Google Cloud 公式ブログ
    misshiki
    misshiki 2026/02/19
    BigQueryに生成AI関数が追加され、SQLからGemini 3.0を直接呼び出し可能に。AI.GENERATEで要約や抽出を構造化出力し、AI.EMBEDやAI.SIMILARITYで意味検索も簡素化。画像などマルチモーダル分析にも対応。
  • https://x.com/googlecloud_jp/status/2024000948083814866

    misshiki
    misshiki 2026/02/19
    BigQueryの生成AI関数AI.GENERATEとAI.GENERATE_TABLEがGA化。SQLからGeminiなどを直接呼び出し要約や分類、翻訳を実行可能に。非構造化データを分析用テーブルへ変換しデータ移動なしでAI分析を実現。
  • https://x.com/ShoheyOkada/status/2023170030922543302

    misshiki
    misshiki 2026/02/17
    BigQueryのAI.GENERATE関数が強化。Gemini呼び出しで翻訳・分類時に出力Descriptionを指定可能に。SQL内で直接記載でき、データベース内でAI処理が完結。
  • 【徹底解説】BigQuery「Conversational Analytics」登場!既存のAI分析ツールと何が違うのか?

    BigQueryのDataAgentの1つである、「Conversational Analytics」がpublic previewとして登場しました! (日語ドキュメントでは現在(2026年2月時点)も『早期アクセス』という表記になっていますが、パブリックプレビューとして利用可能です) 今回の記事では Conversational Analyticsでは何が出来るのか?既存のAIとの差分はどういうものなのかを紹介していきます。 1. はじめに:なぜ今、対話型分析なのか? 「データを民主化したい」 多くの企業が掲げる目標ですが、現実は甘くありません。現場の担当者がデータにたどり着くには、SQLを習得するか、忙しいデータアナリストに依頼して数日待つ必要があります。 これまでも「自然言語でSQLを書くAI」は存在しました。しかし、実際に業務で使おうとすると、社内独自の専門用語や複雑な集計ルー

    【徹底解説】BigQuery「Conversational Analytics」登場!既存のAI分析ツールと何が違うのか?
    misshiki
    misshiki 2026/02/06
    “Conversational AnalyticsはBigQueryコンソール上で、Geminiの力を借りてデータと「対話」できる機能。 「先月のエリア別売上トップ3をグラフにして」と入力すれば、AIが即座にSQLを組み立て、実行し、結果をビジュアライズ”
  • BigQueryのConversational Analytics(対話型分析)を徹底解説 - G-gen Tech Blog

    G-gen の杉村です。BigQuery には Conversational Analytics(対話型分析)機能が備わっており、データに関する質問を生成 AI に対してチャット形式で投げかけることができます。この機能を使うことで、SQL の知識がなくても、自然言語でデータをクエリすることができます。 概要 Conversational Analytics とは 使用イメージ 料金 他の手法との比較 自然言語による BigQuery へのクエリ Looker Studio Pro の Conversational Analytics との違い データエージェント データエージェントとは 設定項目 公開とアクセス制御 データインサイトの自動生成 BigQuery ML 対応 精度向上のために ビジネスロジックの組み込み メタデータの整備 割り当て(Quota) 概要 Conversation

    BigQueryのConversational Analytics(対話型分析)を徹底解説 - G-gen Tech Blog
    misshiki
    misshiki 2026/02/06
    BigQuery の Conversational Analytics は、自然言語でデータに質問するとAIがSQL生成・実行・可視化まで行い、SQL不要で分析できる対話型AI分析機能。
  • Google Cloud コンソールを使用して BigQuery ML で ML モデルを作成する  |  Google Cloud Documentation

    フィードバックを送信 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 BigQuery ML で Google Cloud コンソールを使用して ML モデルを作成する このドキュメントでは、 Google Cloud コンソールを使用して BigQuery ML モデルを作成する方法について説明します。 必要なロール モデルを作成して推論を実行するには、次のロールが付与されている必要があります。 BigQuery データ編集者(roles/bigquery.dataEditor) BigQuery ユーザー(roles/bigquery.user) 始める前に In the Google Cloud console, on the project selector page, select or create a Google Cloud project

    Google Cloud コンソールを使用して BigQuery ML で ML モデルを作成する  |  Google Cloud Documentation
    misshiki
    misshiki 2026/02/03
    “このドキュメントでは、 Google Cloud コンソールを使用して BigQuery ML モデルを作成する方法について説明します。”
  • BigQueryに会話型分析機能(Conversational Analytics)が登場。詳細な分析レポート生成、将来予測や非構造化データの分析も可能に

    BigQueryに会話型分析機能(Conversational Analytics)が登場。詳細な分析レポート生成、将来予測や非構造化データの分析も可能に Google Cloudは、同社の大規模データベースであるBigQueryの新機能として、自然言語を使ってデータを分析できる会話型分析機能(Conversational Analytics)のプレビュー公開を発表しました。 この会話型分析機能は単に自然言語をSQLに変換するものではなく、同社のAIモデルであるGeminiにより、BigQuery上のスキーマやメタデータ、カスタムコマンドなどを用いたビジネスコンテキストを理解した上でSQLを生成し、データ分析やデータの可視化を実現するのが特徴です。 これにより技術者だけでなくビジネスユーザーも、BigQueryの最新データを基盤にしたデータ分析AIエージェントを構築、展開できるようになり

    BigQueryに会話型分析機能(Conversational Analytics)が登場。詳細な分析レポート生成、将来予測や非構造化データの分析も可能に
    misshiki
    misshiki 2026/02/03
    “Google Cloudは、同社の大規模データベースであるBigQueryの新機能として、自然言語を使ってデータを分析できる会話型分析機能(Conversational Analytics)のプレビュー公開を発表しました。”
  • Conversational Analytics APIで自然言語でデータ分析を行う | NHN テコラス Tech Blog | AWS、Google Cloudなどのインフラ技術ブログ

    はじめに お客様と話す際に、生成AIを用いて自然言語でデータ分析をしたいと相談をいただくことが多くなりました。 選択肢の一つとして Google Cloud の Conversational Analytics API を使った場合にどのような形で分析できるのかをご紹介します。 Conversational Analytics API: データ エージェントを構築し、データを使ってチャットするの記事にも紹介されている通り、様々な実行方法があります。 記事ではその中でもStreamlit クイックスタート アプリをCloud Shell上で実行、動作確認を行った内容をご紹介します。 リリース状況について Conversational Analytics API は2025年11月6日現在pre-GAのサービスになります。 現在のリリース状況につきましてはサービスのリリースノートを参照くださ

    Conversational Analytics APIで自然言語でデータ分析を行う | NHN テコラス Tech Blog | AWS、Google Cloudなどのインフラ技術ブログ
    misshiki
    misshiki 2025/11/25
    “ Google Cloud の Conversational Analytics API を使った場合にどのような形で分析できるのかをご紹介します。”
  • 巨大なCSVファイルを「Google スプレッドシート」から直接「BigQuery」へインポート可能に/複雑な分析手順を一気に省略、「Google スプレッドシート」の機能をそのまま利用できる

    巨大なCSVファイルを「Google スプレッドシート」から直接「BigQuery」へインポート可能に/複雑な分析手順を一気に省略、「Google スプレッドシート」の機能をそのまま利用できる
    misshiki
    misshiki 2025/11/18
    “Googleは11月12日(現地時間)、「Google ドライブ」内や「Google スプレッドシート」から直接「BigQuery」に、あらゆるファイルサイズのCSVファイルをインポートできる機能を発表した。”
  • 「自動化」のその先へ。BigQueryが切り拓く「自律型データウェアハウス」の未来

    データの世界に携わる皆さんなら、「データウェアハウス(DWH)の自動化」という言葉を何度も耳にしてきたことでしょう。日々のETLジョブのスケジューリング、リソースの自動スケーリングなど、私たちは「自動化」によって多くの定型業務から解放されてきました。 しかし、今、BigQueryはその一歩先、「自律性(Autonomy)」 を持つDWHへと急速に進化しています。 これは単なるバズワードではありません。「自動化」と「自律性」は、似ているようで根的に異なります。そしてこの「自律性」こそが、データに関わる全ての人々の働き方を根底から変える力を持っています。 日は、BigQueryが目指す「自律型DWH」とは何か、その具体的な機能、そしてそれが私たちの未来に何をもたらすのか、詳しくご紹介します。 🤖 「自動化」と「自律性」:決定的違いとは? まず、この2つの言葉を整理させてください。 自動化

    「自動化」のその先へ。BigQueryが切り拓く「自律型データウェアハウス」の未来
    misshiki
    misshiki 2025/10/28
    “igQueryが目指す「自律型DWH」とは何か、その具体的な機能、そしてそれが私たちの未来に何をもたらすのか、詳しくご紹介します。”
  • Agent Development Kit(ADK) でデータサイエンス AI エージェントを動かしてみる

    はじめに こんにちは、クラウドエースの木村です。 近年、AI エージェント技術は目覚ましい進化を遂げています。単一の指示に応答する従来のチャットボットとは異なり、自律的に思考し、計画を立て、複雑なタスクを実行する能力を持つようになりました。 この先進的なエージェント開発を支援するため、Google は、Google Cloud NEXT'25 にて Agent Development Kit (ADK) を発表しました。 記事では、ADK をこれから利用する開発者の方を対象に、公式サンプルの中からデータ分析に特化した data-science エージェントを取り上げ、その環境構築から実際の動作までを解説します。 対象読者 Google の Agent Development Kit (ADK) の利用を検討している開発者の方 AI エージェント、特に、マルチエージェントシステムの構築に関

    Agent Development Kit(ADK) でデータサイエンス AI エージェントを動かしてみる
    misshiki
    misshiki 2025/08/25
    “Agent Development Kit (ADK) をこれから利用する開発者の方を対象に、公式サンプルの中からデータ分析に特化した data-science エージェントを取り上げ、その環境構築から実際の動作までを解説”
  • BigQueryで機械学習 時系列推移の異常を検知する - ドワンゴ教育サービス開発者ブログ

    はじめに ドワンゴ教育事業でデータアナリストとして働いている小林です。 ZEN大学の開学やR高校の開校で今年の春は例年にもまして賑やかなものでした。ライブストリーミングされていた入学式やオリエン番組などを眺めていると皆様の人生の節目に立ち会えた嬉しさとともに、より良いサービスを作っていきたい思いを強くして、身が引き締まる思いです。 課題について(導入に代えて) KPIダッシュボードを作って運用しているデータアナリストにとって、時系列推移で大きな変動があった時にいち早くキャッチしたいと願うのはとても自然なことです。スパイクがあれば要因を手早く分析してPJメンバーに伝えたいですし、激減した指標があればレコードの欠損から疑わねばなりません。いずれにしてもホットなトピックスを伝えて組織的なリアクションに繋げてもらうためには「検知の早さ」は重要な成功要因であるというのが私の意見です。 そこで、今回は

    BigQueryで機械学習 時系列推移の異常を検知する - ドワンゴ教育サービス開発者ブログ
    misshiki
    misshiki 2025/08/14
    “BigQueryで機械学習:ARIMA_PLUSモデル”
  • 今日から始める Vibe Data Science - Preview となった Data Science Agent でデータ分析してみる

    日 (2025年8月5日) 、Colab Enterprise ならびに BigQuery Studio の Notebook から、Data Science Agent (DSA) をプレビューで利用できるようになりました。 Data Science Agent を使うと、一連のデータ分析作業を Notebook 上で自律的に行ってくれます。 Gemini CLI によるコーディングを Vibe Coding というならば、これは Vibe Data Science と命名できるでしょうか? それでは Data Science Agent により何が実現できるのか、実際にみていきましょう。 BigQuery のテーブルで Vibe Data Science DSA は Colab Enterprise の画面下の Gemini アイコン、または右上の「Gemini」ボタンから呼び出せま

    今日から始める Vibe Data Science - Preview となった Data Science Agent でデータ分析してみる
    misshiki
    misshiki 2025/08/06
    “Colab EnterpriseとBigQuery Studioの Notebookから、Data Science Agent (DSA) をプレビューで利用できるように。一連のデータ分析作業を Notebook 上で自律的に行ってくれます。 Vibe Data Science と命名できる?”
  • BigQueryで自由記述形式のデータを分類する方法 Part 2 ~ Vector Search 編 ~ - Nealle Developer's Blog

    はじめに さて今回はBigQueryで自由記述形式のデータを分類するPart 2ということで、予告通りVector Search を利用したテキスト分類を手軽にできるのか検証していきたいと思います。 (前回のブログでVector Search Indexと述べてますが、Vector Searchを利用するという部分が趣旨になります。) 利用するデータはPart 1と同じ駐車場申し込みのキャンセル理由となりますがインデックスの作成なども検証したかったので前回よりもデータが多めです。 検索対象となるデータが5000件に満たない場合はそもそもインデックスを作成する意味がないため、Vector Search Indexは利用できないのでご注意ください。 なお、結論から言うと前回実施したgeminiIを利用した手法よりは精度が劣っており今回は70%程度の正答率でした。 前回のブログはこちら neal

    BigQueryで自由記述形式のデータを分類する方法 Part 2 ~ Vector Search 編 ~ - Nealle Developer's Blog
    misshiki
    misshiki 2025/07/01
    “BigQueryで自由記述形式のデータを分類するPart 2ということで、予告通りVector Search を利用したテキスト分類を手軽にできるのか検証”
  • 退屈な分析はAIにやらせよう - エムスリーテックブログ

    AI機械学習チームの氏家 (@mowmow1259)です。 このブログはAI機械学習チームブログリレー 8日目の記事です。 前日は高田さんによる「BETWEENに気をつけろ! BigQueryの日次集計で罠にハマった話」でした。 最近LLMによるVibe Codingが世間を賑わせています。 エムスリーでも積極的にコーディングエージェントの導入が進んでおり、かくいう私もClaude Code君がいないと生きていけない体にされてしまいました。 コーディングエージェントのおかげで典型的な開発タスクはかなり効率化されてきているものの、面倒なタスクもまだまだ残されています。 分析です。 前日の高田さんの記事にもある通りエムスリーではBigQueryにデータを集約していますが、BigQuery上のデータでぱっと集計したかったりなど、大体どのテーブルを見にいけばいいか想像がつくけど面倒だな。。みた

    退屈な分析はAIにやらせよう - エムスリーテックブログ
    misshiki
    misshiki 2025/06/30
    “BigQueryの分析用のClaude Codeの設定を検証してみました。 BigQuery用に書きましたが、他のデータソースでも応用が効く内容になっていると思います。”
  • BigQuery MLで貢献度分析:「速く・広く・深い」インサイトを得る方法 - NRIネットコムBlog

    はじめに 貢献度分析とは 今回使うデータの紹介 BigQuery で貢献度分析をする際のステップ ステップ① データの準備 ステップ② モデルの作成 ステップ③ インサイトを見てみよう まとめ はじめに ジブリの音楽を演奏できるようになることを夢見て、最近カリンバという楽器を購入した松村です。 ブログでは、Google Cloud Next 2025 で一般公開機能として紹介された BigQuery ML の貢献度分析(※1)を試した内容をまとめます。今回は、ニューヨーク市のシェアサイクルサービス「Citi Bike」の利用データを使用して、貢献度分析を実施し、データから有益なインサイトを引き出すという一連の流れを紹介してみたいと思います。貢献度分析は、簡単に意味のあるインサイトを網羅的に出せる機能なので、是非最後まで見ていただき、皆さんの業務にも活用してみてください。 (※1)参考:貢

    BigQuery MLで貢献度分析:「速く・広く・深い」インサイトを得る方法 - NRIネットコムBlog
    misshiki
    misshiki 2025/06/30
    “貢献度分析(Contribution Analysis)は、ある特定の成果(数値)に対して、どの要素(ディメンション)がどれくらい影響を与えているのかを明らかにする分析手法です。”