[B! Python][SQL] misshikiのブックマーク

misshiki id:misshiki

PythonとSQLに関するmisshikiのブックマーク (7)

GitHub - pgjones/sql-tstring: SQL-tString allows for f-string like construction of sql queries
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
misshiki 2025/05/19
“SQL-tStringは、SQLインジェクションを許さずに、t-stringベースのSQLクエリを構築できます。基本的な使用方法は以下の通りです。”

SQL

Python
リンク
MCPが便利そうなので Oracle DB とおしゃべりする MCP サーバーを作ってみた - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに最近、MCP(Model Context Protocol)が注目を集めていますね。そこで、MCPを使って、Cursor や Cline などからシームレスに Oracle データベースにアクセスする MCP サーバーを作ってみました。こんな感じでテーブルの構造を聞いてみたりこんな感じで LLM に SQL を書かせて、その場でテストしてみたりすることができます。こちら↓の Claude Desktop と私のチャットの履歴を見ていただくと、Claude Desktop のような出来の良い MCP Host とデータベー
misshiki 2025/04/16
“※本記事で紹介したプロジェクトは実験的なものであり、本番環境での使用は推奨していません。”

SQL

Python

DB／ストレージ

人工知能

プログラミング
リンク
テーブルデータの前処理を何でやるか
最近読んだ、The Rise of Single-Node Processing: Challenging the Distributed-First Mindset という記事に最近考えていたことが書いてあったので便乗して自分の考えを書き留めておく。元記事では、かつては大規模なデータの処理というと何はともあれ分散システムであり、Spark や BigQuery などを導入するのが当然であったが、近年は DuckDB や Polars など、シングルノードでも高速にテーブルデータを処理できる技術が登場してきたことで必ずしも分散システムは必要ではないよねという風潮に変わってきた、ということが述べられている。コスト面でもクラウドを使うのであれば、小さいインスタンスをいくつも立てて分散処理するのと、合計して同程度の vCPU や RAM を持つ一つの大きなインスタンスを立てて処理するのとで料金
misshiki 2025/02/18
“個人的なベストプラクティスとしては、DWH に SQL でクエリする際にはあまり複雑なロジックを入れず、where で指定できるフィルタや、ちょっとしたメタデータの join に留める集約特徴量などの複雑になりがちな計算は Polar

Python

SQL

DB／ストレージ
リンク
GitHub - bruin-data/bruin: Build data pipelines with SQL and Python, ingest data from different sources, add quality checks, and build end-to-end flows.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
misshiki 2024/12/19
“Bruin は、データの取り込み、SQL と Python によるデータ変換、データ品質を 1 つのフレームワークにまとめたデータパイプラインツールです。すべての主要なデータプラットフォームで動作”

Python

SQL
リンク
Jupyter Notebook上でSQLをらくらく実行するJupySQL
Jupyter NotebookやJupyter Labといった、Notebookでデータ分析業務をする人が、ここ数年で増えてきました。 Notebook上でデータ分析をするとき、外部のCSVファイルやDBのデータテーブルなどからデータセットを取得する必要があります。よくあるのが、Pandasを利用し取得したデータセットをデータフレームに格納するケースです。データ規模が大きいほど、ある問題が起こります。例えば、メモリの消費の問題です。データフレームに格納するということは、PCなどのメモリをそれだけ消費します。多くの場合、読み込んだ直後のデータフレームは、そのままデータ分析に使えることは少なく、何かしらの加工なり処理がなされ整えられます。ある程度整えられたデータセットの状態で、データフレームとして格納した方が、メモリの消費量は少なくてすみます。他には、外部DBのパフォーマンス低
misshiki 2023/08/17
“「Jupyter Notebook上でSQLをらくらく実行するJupySQL×DuckDB」”

Jupyter

SQL

DB／ストレージ

Python
リンク
Quick Start — Python documentation
Quick Start# JupySQL allows you to run SQL and plot large datasets in Jupyter via a %sql, %%sql, and %sqlplot magics. JupySQL is compatible with all major databases (e.g., PostgreSQL, MySQL, SQL Server), data warehouses (e.g., Snowflake, BigQuery, Redshift), and embedded engines (SQLite, and DuckDB). It is a fork of ipython-sql with many bug fixes and a lot of great new features!
misshiki 2023/08/17
JupySQLクイックスタート

SQL

Python
リンク
Introducing the Data Validation Tool
The latest news from Google on open source releases, major projects, events, and outreach programs for early career developers. Data validation is a crucial step in data warehouse, database, or data lake migration projects. It involves comparing structured or semi-structured data from the source and target tables and verifying that they match after each migration step (e.g data and schema migratio
misshiki 2021/08/12
“データ検証ツール（DVT）を発表しました。これは、さまざまな環境で検証するための自動化された反復可能なソリューションを提供するオープンソースのPython CLIツールです。”

BigQuery

SQL

Python

GCP
リンク
1