[B! SQL][performance] manabouのブックマーク

manabou id:manabou

SQLとperformanceに関するmanabouのブックマーク (17)

インデックスを理解したい - Qiita
はじめにみなさんはDBのインデックスを正しく使えていますか？私はなんとなく「DBのパフォーマンスを向上するためのもの」という認識はあったのですが、どのような場面で使うものなのか、逆にどのような場面では使うべきでないのかなど明確に理解できていませんでした。今回はそんなインデックスについての理解を深めたいと思います。インデックスとはインデックスとは、その名の通り「索引」です。表現の仕方と変えると、(x, a)という形式の配列であるとも言えます。 xというキー値とそれに結びつくaというデータ情報があり、これを利用することですべてのデータを網羅して見ることなく、まさに本の索引のように目的のデータにたどり着くことができます。インデックスはSQLのパフォーマンスを改善するための非常にポピュラーな手段であり、理由としては下記の3点が挙げられます。アプリケーションのコードに影響を
manabou 2024/03/20
database

db

index

performance

sql
リンク
SQLの実行計画の読み方 |
今回は、SQLを書く上で特にパフォーマンスに影響のあるSQLの実行計画の読み方について解説します。実行計画はデータベース製品によってさまざまに差異がありますが、ここでは比較的どのデータベース製品でも共通する内容について解説します。実行計画とは記述したSQLが実際にデータベースの内部でどのように処理されて結果を返すか、その処理方法を記述した情報です。 A5:SQL Mk-2では、SQLエディタで実行計画を見たい SQL の上にキャレットがある状態でメニューから [SQL(S)] – [SQLの実行計画(J)] または、Ctrl+E で表示できます。表示の仕方はデータベース製品ごとに異なりますが、多くのデータベース製品ではツリー状の情報として表現されます。（このため A5:SQL Mk-2でもツリービューで実行計画を表示します。）ツリーのリーフ（端）から処理が行われ、ルート（根）に向かっ
manabou 2023/05/06
sql

performance

query

tuning

database
リンク
データベースを遅くするための８つの方法
はじめに Twitterのタイムラインを見ていたらバッチ系のプログラムで逐次コミットをやめて一括コミットにしたら爆速になったというのを見ました。当たり前でしょ、と思ったけど確かに知らなければ分からないよね、と思って主に初心者向けにRDBを扱うときの注意点をまとめてみました。プログラミングテクニック的なところからテーブル設計くらいの範疇でDBチューニングとかは入ってないです。自分の経験的にOracleをベースに書いていますが、他のRDBでも特に変わらないレベルの粒度だと思います。大量の逐次コミットをするバッチアプリケーションでDBにデータをインサートすると言うのはかなり一般的な処理です。しかしデータ量が少ない時はともかく大量のインサートを逐次コミットで処理するとめちゃくちゃ遅くなります。数倍から十数倍遅くなることもあるので、10分程度のバッチが１時間越えに化けることもザラにあるので原
manabou 2020/11/16
database

performance

tips

sql
リンク
1000万件オーバーのレコードのデータをカジュアルに扱うための心構え - joker1007’s diary
自分が所属している会社のメンバーの教育用資料として、それなりの規模のデータを扱う時に前提として意識しておかなければいけないことをざっくりまとめたので、弊社特有の話は除外して公開用に整理してみました。大規模データ処理、分散処理に慣れている人にとっては今更改めて言うことじゃないだろ、みたいな話ばかりだと思いますが、急激にデータスケールが増大してしまったりすると環境に開発者の意識が追い付かないこともあるかと思います。そういったケースで参考にできるかもしれません。弊社は基本的にAWSによって運用されているので、AWSを前提にした様なキーワードやサービス名が出てきます。後、句読点があったり無かったりしますが、ご容赦ください。追記: 社内用の資料の編集なのでかなりハイコンテキストな内容だから誤解するかもしれませんが、これらはそもそもRDBの話ではありません。(関係無くは無いけど) 1000万オ
manabou 2020/11/05
database

data

aws

performance

architecture

sql
リンク
MySQLのクエリの良し悪しはrows_examinedで判断する - かみぽわーる
仕事やらなんやらでMySQLのクエリの良し悪しを判断する必要があるとき、EXPLAINの内容だけだとどのぐらい良くなったり悪くなったのか分からないので SET long_query_time = 0; してrows_examined (そのクエリでrows_sent行の結果を返すために何行に触ったのか)も一緒に提示するようにしている(少なくともMySQL 5.7時点ではrows_examinedはslow_query_logでしか確認できないはずperformance_schemaが有効ならevents_statements_historyやその仲間たちで確認できるとのこと*1 MySQL :: MySQL 5.6 リファレンスマニュアル :: 22.9.6 パフォーマンススキーマステートメントイベントテーブル)。例: 上の例のBeforeは、もともとDBAが書いた温かみのあるSQLでO
manabou 2018/03/22
mysql

performance

database

sql
リンク
遅いクエリと向き合ったり、ログ基盤を刷新したり──Cybozu Meetup #6レポート - Cybozu Inside Out | サイボウズエンジニアのブログ
まいど！　コネクト支援チームの風穴（かざあな）です。今回は、7月25日に開催した「Cybozu Meetup #6 大規模サービスを支える名脇役たち」についてレポートします。 Cybozu Meetupとは？「Cybozu Meetup」は、サイボウズのエンジニアとカジュアルに交流する場として企画している、ミートアップイベントです。会場はサイボウズのオフィス（今のところ東京と大阪）なので、社内の雰囲気や社員の様子を、実際に肌で感じて頂ける機会でもあります。開催ペースは、東京オフィスは毎月1回、大阪オフィスは3カ月に1回となっています（今のところ）。これまでに、以下のようなテーマで計6回開催してきました。［02/27］Cybozu Meetup #1 フロントエンド（東京、大阪）　⇒　開催レポート［04/03］Cybozu Meetup #2 SRE（東京）　⇒　開催レポート［0
manabou 2017/09/06
cybozu

slide

performance

sql

query
リンク
なぜ、SQLは重たくなるのか？──『SQLパフォーマンス詳解』の翻訳者が教える原因と対策｜ハイクラス転職・求人情報サイト AMBI（アンビ）
なぜ、SQLは重たくなるのか？──『SQLパフォーマンス詳解』の翻訳者が教える原因と対策『SQLパフォーマンス詳解』の翻訳者の松浦隼人さんに、8つの「SQLが重たくなる原因とその対策」を聞きました。システムのボトルネックになるような「問題のあるSQL」を回避するノウハウを学びましょう。データの操作や定義をする言語「SQL」は、どのような領域を担うエンジニアにとっても必修科目です。しかし、その仕様をきちんと理解し、パフォーマンスに優れたSQLを書ける方はそれほど多くありません。問題のあるSQLを書いてしまい、知らぬ間にそれがシステムのボトルネックになってしまう事態はよく発生します。では、どうすればそうした事態を回避できるのでしょうか？そのノウハウを学ぶため、今回は『SQLパフォーマンス詳解』の翻訳者であり、自身もエンジニアでもある松浦隼人（まつうら・はやと／@dblmkt）さんに8つ
manabou 2017/07/16
sql

performance
リンク
進捗）SSD-to-GPU ダイレクトSQL実行機能 - KaiGaiの俺メモ
ここ暫くブログでまとめていなかった、SSD-to-GPUダイレクトSQL実行機能の進捗について。この機能をかいつまんで言うと、NVMe-SSDに格納されているPostgreSQLのデータブロックをGPU RAMに直接転送し、そこでSQLのWHERE句/JOIN/GROUP BYを実行することで見かけ上のI/O量を削減するという代物である。 NVIDIAのTesla/Quadro GPUが対応するGPUDirect RDMA機能を使い、SSD<=>GPU間のデータ転送を仲介するLinux kernel moduleを使えば、CPU/RAMにデータをロードする前にGPU上での処理を行うことができる。しばらく前からScan系の処理には対応していたが、JOIN/GROUP BYへの対応を加え、さらにPostgreSQL v9.6のCPU並列にも追従したということで、簡単なベンチマークなら取れる
manabou 2017/05/15
ssd

gpu

sql

database

postgresql

performance
リンク
SQLパフォーマンス詳解: 開発者のためのデータベースチューニング解説書
前書きインデックスの内部構造インデックスリーフノード検索ツリー(Bツリー) 遅いインデックスパートI where 句等価演算子プライマリキー複合インデックス遅いインデックスパートII 関数 - where 大文字・小文字を区別する検索ユーザ定義関数インデックスの作り過ぎパラメータ化クエリ範囲検索大なり、小なり、 BETWEEN LIKEフィルタに対するインデックスインデックスの結合部分インデックス OracleにおけるNULL NULLに対するインデックス NOT NULL 制約部分インデックスをエミュレートする処理しにくい条件日付型数値文字列列の連結スマートなロジック数式パフォーマンスとスケーラビリティデータ量システム負荷レスポンスタイムとスループット結合処理入れ子ループハッシュ結合ソートマ
manabou 2016/08/05
sql

performance
リンク
SQLを実行する時、SQLに実行場所を追記する - パルカワ2
ISUCONのPerlアプリでよく使用されているDBIx::Sunnyですが、便利な機能として、SQLがどこで実行されたかを実行されるSQLにコメントする機能があります。こういう感じでスローログに表示されるので、どこでSQLが発行されているか探す必要がなくて便利です。 SELECT * FROM users /* lib/MyApp/Web.pm line 56 */ アプリケーションログではなく、SQL自体にコメントで入っている事が重要で、SQLを改善したい時に見るのは、アプリケーションログではなくスローログを見ます。スローログを見た時点で、どこで発行されたSQLなのかはっきりしていると無駄にそのSQLがどこで発行されたのか、探す必要がなくなり、実際に集中すべきSQLの改善に集中出来ます。というのを、Railsでもやりたかったので、ActiveRecordで作ってみました。github
manabou 2015/07/14
sql

database

bottleneck

slow

rails

activerecord

perl

db

performance
リンク
Where狙いのキー、order by狙いのキー
データモデリングの方法論について解説資料を作りました。ご意見がありましたら、お願いいたします。Twitter: https://twitter.com/hidekatsu_izuno 以下に移行します。今後はこちらがメインとなります。 https://speakerdeck.com/hidekatsu_izuno/detamoderingutekunituku
manabou 2014/12/04
mysql

sql

performance
リンク
開発者のためのSQLパフォーマンスの全て
前書き - インデックスの作成はなぜ開発者のタスクなのかインデックスの内部構造 - インデックスは何に似ているかインデックスリーフノード - 二重連結リスト検索ツリー(Bツリー) - バランス木遅いインデックスパートI - インデックスを遅くする2つの原因 where 句 - 検索のパフォーマンスを改善するためにインデックスを作成等価演算子 - 一致するキーの検索プライマリキー - インデックスの使い方を確認複合インデックス - 複数列に対するインデックス遅いインデックスパートII - 前の問題点が再び関数 - where句の中での関数大文字・小文字を区別する検索 - UPPERと LOWER ユーザ定義関数 - 関数インデックスの制限インデックスの作り過ぎ - 冗長性の排除法パラメータ化クエリ - セキュリティとパフォーマンスのために範囲検
manabou 2014/10/20
index

database

document

SQL

performance
リンク
SQLデータベースに正しインデックスを作るのは誰の役割？
SQLのパフォーマンス問題は、SQLそのものと同じぐらいの歴史がある―― ある人は、SQLはそもそも遅いものだとすら言うかもしれません。これは、SQLの歴史が始まった頃は正しかったかもしれませんが、今となっては全く当てはまらないでしょう。にもかかわらず、SQLのパフォーマンス問題は今も一般的でよくあることです。どうしてそうなってしまうのでしょうか？ SQL言語は、恐らく最も成功した第4世代言語(4GL)でしょう。その最大の利点は、「何を」と「どのように」を分離できることです。SQL文は、どのようにそれを実行するかを記述せずに、単純に何を必要としているかのみの記述になっています。以下のような例を考えてみましょう。 SELECT date_of_birth FROM employees WHERE last_name = 'WINAND'SQLのクエリは、データを要求する英語の文として読
manabou 2014/10/18
sql

index

performance

programming
リンク
限界までMySQLを使い尽くす!!
どこまで出来るか?!やれるところまでやってやるぜ!!と、威勢が良いのは若い間だけの話。オトナのオトコは、攻めるときはとことん攻めるが自らの限界もわきまえて賢く振る舞うのがスマートってものである。というわけで、今日はMySQLのいろいろな限界についてまとめてみる。皆さんも是非MySQLの限界を知り、MySQLをもっとスマートに使って頂きたい。 SQL文の最大長 MySQLサーバーが実行出来るSQL文の最大長は、max_allowed_packetシステム変数で表される。max_allowed_packetの最大値は1GBである。max_allowed_packetの値はセッションごとにも設定可能なので、デフォルトではそこそこの値（16MBなど）に設定しておいて、必要に応じて大きな対を使うと良いだろう。データベースの個数データベースオブジェクトの個数に制限はない。データベースオブジェクトは
manabou 2009/05/20
database

development

mysql

performance

sql
リンク
https://labs.cybozu.co.jp/blog/kazuho/archives/2008/06/mysql_direct_access.php
manabou 2008/06/13
database

mysql

performance

programming

sql
リンク
ウノウラボ Unoh Labs: MySQL5からのインデックス結合で１テーブル複数インデックスを使う
GT Nitro: Car Game Drag Raceは、典型的なカーゲームではありません。これはスピード、パワー、スキル全開のカーレースゲームです。ブレーキは忘れて、これはドラッグレース、ベイビー！古典的なクラシックから未来的なビーストまで、最もクールで速い車とカーレースできます。スティックシフトをマスターし、ニトロを賢く使って競争を打ち破る必要があります。このカーレースゲームはそのリアルな物理学と素晴らしいグラフィックスであなたの心を爆発させます。これまでプレイしたことのないようなものです。 GT Nitroは、リフレックスとタイミングを試すカーレースゲームです。正しい瞬間にギアをシフトし、ガスを思い切り踏む必要があります。また、大物たちと競いつつ、車のチューニングとアップグレードも行わなければなりません。世界中で最高のドライバーと車とカーレースに挑むことになり、ドラッグレースの王冠
manabou 2007/11/01
mysql

performance

programming

sql

tips

db

database
リンク
PostgreSQL パフォーマンスチューニングまとめ - 徒然なるままにBlog
PostgreSQLをチューニングする機会があったのでその時に調べたチューニング項目を備忘録として残しておきます。バージョンの違いやサーバの規模などによっても効果は変わってくると思うのであくまで参考程度のものですが。・shared_buffers 7系では8000〜10000程度まで引き上げる 8系では150000程度まで引き上げることが可能、100000程度が性能のピークこれに多く割り当てるよりOSのバッファ領域として使う方が性能が向上するテーブルサイズを割り出して設定するのがベスト簡単に設定するなら搭載メモリ量の1/4、搭載メモリが多ければ1/2ぐらいでも可・max_connections 7系では256程度、8系では1000程度が性能のピーク・work_mem(sort_mem) 適切なサイズに調整する、2048〜4096程度プロセス毎
manabou 2007/07/24
database

performance

postgres

sql

postgresql

tuning

tips
リンク
1