[B! sql][postgresql] manabouのブックマーク

manabou id:manabou

sqlとpostgresqlに関するmanabouのブックマーク (7)

オレ的EXPLAIN技を語っちゃうゾ - Qiita
メリークリスマス本記事はPostgreSQL Advent Calendar 2021の25日目です。今年も面白い記事がたくさん揃いましたね！！！さて、みなさん今年のPostgreSQLライフはどんな感じでしたでしょうか？私はというと、なんだかチューニングばっかりやってました。1案件でいろいろお手伝いすることはまあまああったのですが、複数から次々チューニングの相談をもらって、歴代継承者の個性を発現したデクくんのごとく駆け回ったのが今年のハイライトです。（この綱渡り感、、、伝われ！！！）俺たちは雰囲気でチューニングしている今回上手くいったけど、あの時たまたまひらめいた1案をぶつけてみたら効果でたのであって、次善の策なんてなかったけど？？って毎回思ってるから、雰囲気でやっていると思う、マジで。コミュニティのノリだと笑いが起きていいんですけど、少しでも勝率を上げるために、若手の前でド
manabou 2021/12/26
explain

database

rdbms

postgresql

tuning

sql
リンク
gstore_fdw: GPUメモリをSQLで読み書き、そして…。 - KaiGaiの俺メモ
昨年、PGconf.ASIAで発表したPL/CUDAによる創薬ワークロードの高速化実験のテーマであるが、 kaigai.hatena blog.com 実測したベンチマークを見ると、奇妙な傾向が見てとれる。このワークロードにおける計算量は「Qの行数×Dの行数」であるので、Dの行数が同じ1000万行であるならば、Qの行数が1000のケース（22.6s）に比べ、Qの行数が10のケース（13.4s）の実行時間はもっと顕著に短時間でなければならない。計算量が1/100なのに、実行時間は半分弱にしかなっていない。実はこれは、化合物同志の類似度を計算するための時間だけでなく、PL/CUDA関数に与える引数をセットアップするための時間に12秒程度を要しており、アムダールの法則を引用するまでもなく、類似度の計算を高速化するだけでは処理速度はこれ以上伸びないのである。 PL/CUDA関数の引数として行列
manabou 2017/11/13
gpu

database

postgresql

sql

cuda

fdw

numpy

r

python
リンク
カスタムロジックをWHERE句で使う - KaiGaiの俺メモ
しばらくSSD-to-GPUダイレクトSQL実行の開発にどっぷり時間を突っ込んでいたので、久々にPL/CUDAネタ。この辺のネタや、 kaigai.hatena blog.com この辺のネタで kaigai.hatena blog.com 紹介したように、PG-Stromはユーザ定義関数をCUDA Cで記述するための機能（PL/CUDA）を持っており、これを使えば、データベースから読み出したデータをGPUに流し込み、GPU上でカスタムのロジックを実行した後、結果をまたSQLの世界へ戻すという事ができる。この仕組みはPostgreSQLの手続き言語ハンドラの機能を用いて実装されており、ユーザ定義のPL/CUDA関数が呼び出される毎に、手続き言語ハンドラが以下の処理を行う。ユーザ記述のCUDA Cコードブロックをテンプレートに埋め込んで、ビルド可能なソースコードを作成。 NVRTC(NVI
manabou 2017/11/13
sql

cuda

gpu

database

postgresql
リンク
SQLトランザクション分離実践ガイド | POSTD
(注：2017/10/16、いただいたフィードバックを元に翻訳を修正いたしました。) (注：2017/10/11、いただいたフィードバックを元に翻訳を修正いたしました。) データベースのドキュメントで分離レベルを目にして、軽く不安を感じつつ、あまり考えないようにしたことはないでしょうか。トランザクションの日常の使用例できちんと分離について言及しているものはほとんどありません。多くはデータベースの初期設定の分離レベルを利用しており、後は運頼みです。しかし、本来、理解しておくべき基本的なトピックであり、いくらか時間を投入してこのガイドの内容を学習すれば、もっと快適に作業できるようになるでしょう。私はこの記事の情報を学術論文、PostgreSQLドキュメンテーションから集めました。分離レベルの何たるかだけでなく、適用の正確さを保持しつつ最大速度で使うにはいつ使うべきか、という疑問に答えるべ
manabou 2017/10/11
sql

transaction

postgresql

database

algorithm
リンク
進捗）SSD-to-GPU ダイレクトSQL実行機能 - KaiGaiの俺メモ
ここ暫くブログでまとめていなかった、SSD-to-GPUダイレクトSQL実行機能の進捗について。この機能をかいつまんで言うと、NVMe-SSDに格納されているPostgreSQLのデータブロックをGPU RAMに直接転送し、そこでSQLのWHERE句/JOIN/GROUP BYを実行することで見かけ上のI/O量を削減するという代物である。 NVIDIAのTesla/Quadro GPUが対応するGPUDirect RDMA機能を使い、SSD<=>GPU間のデータ転送を仲介するLinux kernel moduleを使えば、CPU/RAMにデータをロードする前にGPU上での処理を行うことができる。しばらく前からScan系の処理には対応していたが、JOIN/GROUP BYへの対応を加え、さらにPostgreSQL v9.6のCPU並列にも追従したということで、簡単なベンチマークなら取れる
manabou 2017/05/15
ssd

gpu

sql

database

postgresql

performance
リンク
SQLのテストをDockerでやるとすごく便利だった話 - Qiita
DBのダンプを取得して、少し加工して別DBサーバーに持っていく作業が必要でSQLのテストを行う際にDockerでDBサーバーを使ってみたらとても便利だったのでメモ結論 DBサーバーの起動、破棄が高速でとても便利 PostgreSQLやMySQLの公式リポジトリがあるのでわざわざDockerfileを作らなくても良い。タグによって複数のバージョンもあるので試験環境も合わせやすい docker commitコマンドによって任意のタイミングの状態のDBサーバーをイメージ化する事もできる(DDL定義後など) DBが関係するようなテストでもDocker使うととても便利そう参考 DockerHub postgres MySQL, PostgreSQL ちょっとお試し用 Docker コンテナの起動と廃棄 psqlでパスワード入力を省略するやってみる Dockerは既にインストール済みの想定 #
manabou 2015/11/10
docker

sql

test

postgresql

psql

dump
リンク
PostgreSQL パフォーマンスチューニングまとめ - 徒然なるままにBlog
PostgreSQLをチューニングする機会があったのでその時に調べたチューニング項目を備忘録として残しておきます。バージョンの違いやサーバの規模などによっても効果は変わってくると思うのであくまで参考程度のものですが。・shared_buffers 7系では8000〜10000程度まで引き上げる 8系では150000程度まで引き上げることが可能、100000程度が性能のピークこれに多く割り当てるよりOSのバッファ領域として使う方が性能が向上するテーブルサイズを割り出して設定するのがベスト簡単に設定するなら搭載メモリ量の1/4、搭載メモリが多ければ1/2ぐらいでも可・max_connections 7系では256程度、8系では1000程度が性能のピーク・work_mem(sort_mem) 適切なサイズに調整する、2048〜4096程度プロセス毎
manabou 2007/07/24
database

performance

postgres

sql

postgresql

tuning

tips
リンク
1