[B! DB] torimetalのブックマーク

僕たちは本当のSQLite3を何も知らない（柔軟なデータ型と外部キー制約の罠について） - give IT a try

「えっ、SQLite3ってこんな仕様なの！？」と最近ビックリしたことを紹介します。たとえばこんな2つのテーブルがあったとします。 CREATE TABLE blogs ( id int primary key, title varchar(32) ); CREATE TABLE comments ( id int primary key, content varchar(32), blog_id int, foreign key (blog_id) references blogs(id) ); ポイントはcommentsテーブルのblog_idにはblogs(id)への外部キー制約が貼ってあることです。もちろん、blog_idもblogs(id)も、どちらもint型です。で、以下のようなSQLを発行します（blog_idの値に注目）。 -- blogsにデータを追加 INSERT

torimetal 2023/05/26

DB

リンク

Microsoft SQL Serverのインデックスまとめ

sqlserver_index.md インデックスの主なオプションクラスター化 / 非クラスター化クラスター化インデックスクラスター化インデックスは、テーブルまたはビュー内のデータ行をそのキー値に基づいて並べ替え、格納します。クラスター化インデックスは、インデックス定義に含まれる列です。データ行自体は 1 つの順序でしか並べ替えられないので、1 つのテーブルに設定できるクラスター化インデックスは 1 つだけです。テーブル内のデータ行が並べ替えられた順に格納されるのは、テーブルにクラスター化インデックスが含まれているときだけです。テーブルにクラスター化インデックスが含まれている場合、そのテーブルをクラスター化テーブルと呼びます。クラスター化インデックスが含まれないテーブルのデータ行は、ヒープと呼ばれる順序付けられていない構造に格納されます。非クラスター化インデックス非クラ

torimetal 2022/08/09

リンク

SQL Server のインデックス設計

torimetal 2022/08/09

リンク

持続可能なデータベースドキュメント生成 | メルカリエンジニアリング

この記事は Merpay Tech Openness Month 2022 の17日目の記事です。はじめにこんにちは。Credit Design Teamでバックエンドエンジニアをしている@tk8です。主にメルペイスマート払いに関わるマイクロサービスの開発や運用をしています。この記事では、私のチームでの持続可能なデータベースドキュメントへの取り組みに関して紹介します。背景私が担当しているマイクロサービスでは歴史的経緯（*1)もあり複雑なスキーマ設計をしています。また、領域的にドメイン知識が複雑なものも多く、バックエンドエンジニアでもデータとスキーマの関連に関して理解が難しいことが多々ありました。さらに私のチームではQAエンジニアやPMもデータベースに関するドキュメントを読むことがあり、不明点があれば都度詳しそうな人に聞いたり過去のSlackでの会話を調べたりするなど非効率な状態

torimetal 2022/04/28

DB

リンク

A5:SQL Mk-2に回帰した話 | フューチャー技術ブログ

はじめにTIG/DXチームの宮崎将太です。みなさま、ER図を作成するとき、どんなツールを使っていますか？タイトル通りの出オチですが、数度の輪廻転生を経て私はA5:SQL Mk-2（以下A5M2）を使用しています。ツールをお勧めする記事は多数ありますが、意外と現場のリアルな事情を踏まえた投稿は見当たらなかったので、経験を踏まえてER図作成ツールの比較検討していきたいと思います。 What’s A5M2真面目な比較検討は後述しますが、文脈の都合上最低限度の情報としてA5M2が何者か記載しておきます。無料のER図作成ツール兼SQLクライアント https://a5m2.mmatsubara.com/ 古くは2007年から開発が続けられており、ER図作成ツールとしては超古参。内部的には1997年から脈々と開発が続けられています。最近(2022/1/23)も大幅なUpdateが加えられまし

torimetal 2022/04/26

DB
開発

リンク

SQL Serverにおけるインデックスの再構成と再構築の性能比較 - ZOZO TECH BLOG

こんにちは。開発部基幹SREチームの廣瀬です。弊社では、システムの一部にSQL Serverを使用しています。本記事では、SQL Serverにおけるインデックスのメンテナンス方法である再構成と再構築について、それぞれを実行した場合のクエリ性能の比較結果をご紹介したいと思います。比較を実施するに至った背景の前に、まずはインデックスの再構成と再構築について説明したいと思います。インデックスの再構成と再構築インデックス SQL Serverのインデックスについて簡単にご紹介します。下図は、SQL Serverのデータ構造の概略図です。テーブルは、1つ以上のインデックスから構成されます。なお、ヒープという別のデータ構造だけからテーブルを構成することもできますが、今回は省略します。インデックスは複数のページから構成されます。各ページは論理的につながりを持ちB-Treeを形成します。

torimetal 2022/04/05

リンク

並べ替えできるデータをデータベースに保存する方法

システム開発を行っているとよく、クライアントからデータを任意の順番に並び替えたいという要望があります。並び替えを実行するプログラムは、配列の順序を変えるだけなので簡単ですが、その順序をデータベースにどうやって保存するかという点についてはいつも迷ってしまいます。これには色々なやり方がありますので、まとめてみました。 8つの方法今回は8つの方法に分けてみましたが、いくつかの方法は組み合わせて使えると思いますし、さらに工夫した方法もあると思います。方法1～6は大きなくくりとしてよく見かけるものです。方法7方法8は私が考えたもので見たことがないし私自身も実装したことが無いのですが、飛躍したアイデアでもないので載せました。対象のデータベースは主にRDBですが、KVSに向いているかどうかも（良い・普通・悪い）の3段階で書いています。データ構造と使い方の説明は書いていますが、具体的な実装は書いて

torimetal 2022/01/19

設計
DB

リンク

SQL Serverのインデックス設計基準

RDBMSのボトルネックは99%ディスクI/Oにある。CPUや物理メモリに比べて、ハードディスクの速度はかなり遅い。気が遠くなるぐらい遅い。インデックスを効果的に設計すれば劇的にディスクI/Oコストを減らすことができる。インデックスって何だ？まず簡単に基礎知識。インデックスには、クラスタ化インデックスと非クラスタ化インデックスがある。大雑把に言えば、クラスタ化インデックスとはレコードデータ自体のディスク上での順序を表す。だから、テーブル毎に一つしか作れない。クラスタ化インデックスの順序が隣接しているという事は、データが物理的に隣接されてディスクに格納されているという事である。 SQL Serverは、データを「ページ」という概念で格納する。I/Oは全てこの8KBのページが最小単位である。レコードをたった一行取得する場合でもページ毎に読み出される。クラスタ化インデックスの順序が近いデータ

torimetal 2022/01/19

設計
DB

リンク

Do Not Waste Performance By Not Using Temp Tables With Entity Framework Core

torimetal 2021/12/22

DB
EFCore

リンク

Designing an Entity-Attribute-Value model with Entity Framework Core - Ekobit

torimetal 2021/09/07

設計
DB

リンク

PostgreSQLのアンチパターン : 何でもかんでもjsonに入れる | Yakst

PostgreSQL 9.2より追加されたJSON型だが、特徴を理解して適切に使わないと色々な副作用に悩まされることになる。その問題点を挙げると共に、どのような場合に使うべきかの指針を示す。 PostgreSQLは、データ型としてjsonをサポートしています。しかし、やりたいことがある時に何でもかんでもjson型を使ってしまうというのはやめるべきです。これは、hstoreや新しく登場したjsonb型にも同じことが言えます。これらの型は必要な時には便利なツールになりますが、PostgreSQLでデータのモデリングを行う際に最初に検討すべきものではありません。なぜなら、データを呼び出したり操作したりするのが難しくなってしまうためです。何もかも同じところに入れてしまおうとすることによるアンチパターンをご存知の読者もいるでしょう。EAVアンチパターンは、長らくデータベーススキーマにおける必要悪

torimetal 2021/05/28

リンク

データベースを遅くするための８つの方法

はじめに Twitterのタイムラインを見ていたらバッチ系のプログラムで逐次コミットをやめて一括コミットにしたら爆速になったというのを見ました。当たり前でしょ、と思ったけど確かに知らなければ分からないよね、と思って主に初心者向けにRDBを扱うときの注意点をまとめてみました。プログラミングテクニック的なところからテーブル設計くらいの範疇でDBチューニングとかは入ってないです。自分の経験的にOracleをベースに書いていますが、他のRDBでも特に変わらないレベルの粒度だと思います。大量の逐次コミットをするバッチアプリケーションでDBにデータをインサートすると言うのはかなり一般的な処理です。しかしデータ量が少ない時はともかく大量のインサートを逐次コミットで処理するとめちゃくちゃ遅くなります。数倍から十数倍遅くなることもあるので、10分程度のバッチが１時間越えに化けることもザラにあるので原

torimetal 2020/11/15

リンク

1000万件オーバーのレコードのデータをカジュアルに扱うための心構え - joker1007’s diary

自分が所属している会社のメンバーの教育用資料として、それなりの規模のデータを扱う時に前提として意識しておかなければいけないことをざっくりまとめたので、弊社特有の話は除外して公開用に整理してみました。大規模データ処理、分散処理に慣れている人にとっては今更改めて言うことじゃないだろ、みたいな話ばかりだと思いますが、急激にデータスケールが増大してしまったりすると環境に開発者の意識が追い付かないこともあるかと思います。そういったケースで参考にできるかもしれません。弊社は基本的にAWSによって運用されているので、AWSを前提にした様なキーワードやサービス名が出てきます。後、句読点があったり無かったりしますが、ご容赦ください。追記: 社内用の資料の編集なのでかなりハイコンテキストな内容だから誤解するかもしれませんが、これらはそもそもRDBの話ではありません。(関係無くは無いけど) 1000万オ

torimetal 2020/11/04

リンク

Home | DBML

Intro DBML (Database Markup Language) is an open-source DSL language designed to define and document database schemas and structures. It is designed to be simple, consistent and highly-readable. It also comes with command-line tool and open-source module to help you convert between DBML and SQL. Table users { id integer username varchar role varchar created_at timestamp } Table posts { id integer

torimetal 2020/11/02

DB
sql

リンク

データベースをリファクタリングしたお話 - BASEプロダクトチームブログ

基盤チーム所属の沖中( @okinaka )です。「リファクタリング」という言葉、エンジニアのみなさんならご存知でしょう。システムの振る舞いを変えずに内部を改善することを指す言葉です。一般的に、コードの修正を指すことがほとんどですが、今回はデータベース設計のリファクタリングについてお話ししたいと思います。絶版になってしまいましたが、データベース・リファクタリングという書籍に様々な手法が紹介されていて参考になります。英語で良ければ原書はまだ入手可能ですね。データベース・リファクタリング作者:スコット W アンブラー,ピラモド・サダラージ発売日: 2008/03/26メディア: 単行本 Refactoring Databases: Evolutionary Database Design (Addison-Wesley Signature Series (Fowler)) (

torimetal 2020/10/04

リンク

データベースのドキュメント管理を自動化した話 - estie inside blog

こんにちは、今回はデータ基盤構築を担当しているmarushoがお送りします。今日はestieで実践しているデータベースのドキュメント管理方法をご紹介します。はじめに独自成長していくデータベースたち失われたドキュメントどうすれば低コストなドキュメント管理ができるのかそして生まれた、schema collectorという自動化ツール SchemaSpy Mysql diff Priv Page ECS タスクスケジューラドキュメントを腐らせないおわりにはじめに estieはオフィスを中心とした不動産データを取り扱うスタートアップ企業です。 estie（オフィス探しサービス）とestie pro（不動産事業者向けデータプラットフォーム）の2つのサービスを運営しています。詳しくは、こちらの記事をご覧ください。 inside.estie.co.jp estieでは、不動産に関する

torimetal 2020/10/04

リンク

DBアタマアカデミー記事一覧 | gihyo.jp

最終回　治療としてのパフォーマンスチューニング―システムの病気はどう治す？（3）ミック 2011-04-01

torimetal 2020/09/02

リンク

SQLのインデックスとそのチューニングについてのオンラインブック

開発者向けのSQLインデックス解説サイト、管理についての間違いない知識を提供します。インデックスは開発時には忘れられがちである一方で、非常に効果的なSQLのチューニング方法です。Use The Index, Lukeでは、HibernateなどのORMツールの解説にとどまらず、SQLのインデックスについて基礎から説明します。 Use The Index, LukeはSQLパフォーマンス詳解のWeb上の無料版です。サイトを気に入って頂けたら、ぜひ書籍も購入してみて下さい。また、このサイトの運営をサポートする様々なグッズも販売しています。 MySQL、Oracle、SQL ServerなどにおけるSQLのインデックスUse The Index, Lukeでは、ベンダにとらわれないインデックスの説明を心がけています。製品特有の事柄については、以下のような表示をしています。 DB2Use The

torimetal 2020/03/30

sql
DB

リンク

イミュータブルデータモデル - kawasima

CRUDのうちUPDATEがもっともシステムを複雑化する。更新には複雑なルールが伴うからだ。業務的に複雑なルールが存在するのは仕方ないこともあるが、システム、設計で複雑さを更に増さないようにしたい。UPDATEに着目し、その発生をできるだけ削ることによって複雑さをおさえるためには、まずデータモデルをそのように設計しておかなけれなならない。このイミュータブルデータモデルは、それを手助けする手法で、手順に沿って実施すればある程度のスキルのバラつきも吸収できるように組み立てられている。

torimetal 2020/03/11

リンク

なぜBTreeがIndexに使われているのか - maru source

※この内容は個人的な考察なので、間違っている箇所もあると思います。そういう部分を見つけた際はぜひ教えて下さい。 RDBMSの検索を早くするためにIndexって使いますよね。例えばこんなテーブル CREATE TABLE user ( id INT UNSIGNED NOT NULL, name VARCHAR(255) NOT NULL, UNIQUE INDEX (id) ); idカラムにIndexを張っています。これはidでの検索を高速にするためです。ここでidカラムにIndexが貼っていない場合と比べると検索時間が大幅に変わってきてしまいます（特にレコードが多くなった時) ではなぜIndexを貼ると検索が早くなるんでしょう？？ Indexとはその名の通り索引を意味します。特定のカラムの索引を作成しておくことで検索を高速化します。 (本の最後によみがな順で単語が並べられたりしています

torimetal 2019/12/27

リンク

はてなブックマーク

タグ

関連タグで絞り込む (10)

DBに関するtorimetalのブックマーク (21)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス