公式リポジトリより引用 非常に便利なのですが、昔からあるテーブルなどは、Descriptionが埋まっておらず、一見なんのデータが入っているカラムなのかわからないことがあるので、BigQueryのデータを対象に、サンプルレコードをとってきて、秘匿情報をマスクしてOpenAIのAPIを実行する実装を書いてみました。なお、この実装はアイディアベースのものでまだ本番運用に耐えるものではありません。 技術要素としては秘匿情報のマスクはDLPを活用しています。ちょこちょこサンプリングしているといい感じにマスクしてくれるので結構便利です。 import glob import os import textwrap import google.cloud.dlp import openai from google.cloud import bigquery from google.cloud.dlp i