[B! algorithm][index] manabouのブックマーク

MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと | Raccoon Tech Blog [株式会社ラクーンホールディングス技術戦略部ブログ]

株式会社ラクーンホールディングスのエンジニア/デザイナーから技術情報をはじめ、世の中のためになることや社内のことなどを発信してます。 bashパフォーマンスMySQLInnoDB DB設計インデックスこんにちは、羽山です。今回は MySQL のプライマリキーに UUID を採用する場合に起きるパフォーマンスの問題を仕組みから解説します。 MySQL(InnoDB) & UUID のパフォーマンスについては各所でさんざん議論・検証されていますが、論理的に解説した記事が少なかったり一部には誤解を招くようなものもあるため、しっかりと理由から理解するための情報として役立つことができればと思っています。 UUID と比較される古き良き昇順/降順のプライマリキーはというと、 MySQL の InnoDB において良いパフォーマンスを出すために縁の下の力持ちのような働きをしてくれているケースが実は少な

manabou 2021/09/01

リンク

B TreeとB+ Treeの違い - Carpe Diem

概要インデックスに対してMongo DBはB Treeを採用し、MySQLのInnoDBはB+ Treeを採用しています。どうして採用しているアルゴリズムが違うのだろう？と思って調べてみました。主な違い B+ TreeはほとんどB Treeと同じですが、以下の点が異なります。リーフノードとリーフノードを結ぶポインタがあるデータはリーフノードのみに保持する具体例言葉だけだと分かりにくいので、Visualizeするツールを使って具体例を表示します。 [1, 2, 3, 4, 5, 6, 8, 10, 15, 18]という数列に対し、Order: 3で作ってみます。 Orderは１ノードから出る枝の数のことです。 B Tree B-Tree Visualization B+ Tree B+ Tree Visualization 先程のB Treeと違って、データはリーフノードに持つの

manabou 2017/05/17

リンク

ハクビシンにもわかる全文検索 - Qiita

高速な全文検索アルゴリズムであるFM-indexについて解説する。理解しがたい点や間違っている点があれば是非コメントで指摘してほしい。概要 FM-indexはリニアな文字列に対して検索をするアルゴリズムで、主に簡潔データ構造とBWT(およびLF mapping)という二つのアイデアから成り立っている。BWTはBurrows-Wheeler変換のことで、文字列を特殊な並び順に変換するという可逆関数である。BWTされた文字列を簡潔データ構造固有の操作をすることで、クエリ文字列の長さに比例した短い時間で文字列を探し出すのがFM-indexだ。簡潔データ構造簡潔データ構造に関してはFM-indexで必要となる二つの関数だけ説明して、詳細は次の機会に譲るとする。さて、二つの関数はともに文字列のある位置より前の部分に含まれている文字の数を数え上げるというものでrank()とrankLessTha

manabou 2015/07/21

リンク

中学生にもわかるウェーブレット行列 - アスペ日記

id:echizen_tm さんの記事「ウェーブレット木の効率的で簡単な実装 "The Wavelet Matrix"」から始まったウェーブレット行列ブームから半年以上が過ぎ、すでに枯れた技術として確立されつつある感があります。 …嘘です。日本以外ではあんまり来ていません。理由としては、やはりアルファベット圏では単語境界が明確であるため、こちらの記事で書かれているような「キーワード分割の難易度」といったことがあまり問題にならないということがあるかもしれません。まあ、そういうわけで局所的に来ているウェーブレット行列ですが、日本語をはじめとする単語境界のない言語圏にとっては重要なネタであると思うため、解説記事を書き直して*1みようと思います。ウェーブレット行列でできること主となる操作は、文字列に対する定数時間の rank() と select()*2 です。 rank() は、「文

manabou 2013/03/04

リンク

インデックスの基礎知識

■ インデックスとはデータベースの世界で、インデックス(索引)とはテーブルに格納されているデータを高速に取り出す為の仕組みを意味します。インデックスを適切に使用することによってSQL文の応答時間が劇的に改善される可能性があります。インデックスにはB-Treeインデックスをはじめ、ビットマップインデックス、関数インデックスなどの種類がありますが、ここでは最も一般的に使われ、かつほとんどのDBMSでサポートされているB-Treeインデックスについて解説します。 ※ CREATE INDEX文でオプションを指定しない場合は通常B-Treeインデックスが作成されます。 ■ B-Treeインデックスのしくみ B-Tree(Balanced Tree)インデックスは次のようなツリー状の構造になっています。ツリーの先頭はヘッダブロックと呼ばれています。ヘッダブロックでは、キー値の範囲

manabou 2012/07/05

リンク

Similarity Joinの話 - ｜ω・)ノ＜黒猫の気まぐれ日記

何か論文読んで，それについて発表するという授業があるのですが，そこでSimilarity Joinについて調べたのでここにメモします．●Similarity Joinって何？すごく大雑把に言うと，類似しているものを結合すること．そのまんまですね．例えば，上図のように4つのタプルがあったら，それぞれ類似しているもの同士でJoinします．普通は閾値を与えて，類似度が閾値以上であれば類似していると判断し，Joinします．#出力の部分は出力例であり，実際には他の組み合わせも出力されうると思います●類似しているってどうやって判断するの？Similarity Joinを行うためには，類似度の高い組み合わせを見つける必要があります．類似度を算出する方法はよく使われる手法がいくつかあります．（Jaccard, cosine, overlapなどなど）他にも，距離という概念でみると，Hamming dist

manabou 2011/02/16

リンク

はてなブックマーク

タグ

関連タグで絞り込む (15)

algorithmとindexに関するmanabouのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2025年10月第3週）

今週のはてなブックマーク数ランキング（2025年10月第2週）

今週のはてなブックマーク数ランキング（2025年10月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス