[B! index] manabouのブックマーク

manabou id:manabou

indexに関するmanabouのブックマーク (40)

インデックスを理解したい - Qiita
はじめにみなさんはDBのインデックスを正しく使えていますか？私はなんとなく「DBのパフォーマンスを向上するためのもの」という認識はあったのですが、どのような場面で使うものなのか、逆にどのような場面では使うべきでないのかなど明確に理解できていませんでした。今回はそんなインデックスについての理解を深めたいと思います。インデックスとはインデックスとは、その名の通り「索引」です。表現の仕方と変えると、(x, a)という形式の配列であるとも言えます。 xというキー値とそれに結びつくaというデータ情報があり、これを利用することですべてのデータを網羅して見ることなく、まさに本の索引のように目的のデータにたどり着くことができます。インデックスはSQLのパフォーマンスを改善するための非常にポピュラーな手段であり、理由としては下記の3点が挙げられます。アプリケーションのコードに影響を
manabou 2024/03/20
database

db

index

performance

sql
リンク
MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと | Raccoon Tech Blog [株式会社ラクーンホールディングス技術戦略部ブログ]
株式会社ラクーンホールディングスのエンジニア/デザイナーから技術情報をはじめ、世の中のためになることや社内のことなどを発信してます。 bashパフォーマンスMySQLInnoDB DB設計インデックスこんにちは、羽山です。今回は MySQL のプライマリキーに UUID を採用する場合に起きるパフォーマンスの問題を仕組みから解説します。 MySQL(InnoDB) & UUID のパフォーマンスについては各所でさんざん議論・検証されていますが、論理的に解説した記事が少なかったり一部には誤解を招くようなものもあるため、しっかりと理由から理解するための情報として役立つことができればと思っています。 UUID と比較される古き良き昇順/降順のプライマリキーはというと、 MySQL の InnoDB において良いパフォーマンスを出すために縁の下の力持ちのような働きをしてくれているケースが実は少な
manabou 2021/09/01
mysql

uuid

key

index

performance

algorithm
リンク
MySQLとインデックスと私
2021/05/24 サイボウズ開運研修動画が以下のサイトからリンクされています - https://blog.cybozu.io/entry/2021/07/20/100000 - これに矢印を書きながらぐりぐりやっていたわけなので、資料単体だとわかりづらいと思います…
manabou 2021/05/25
slide

mysql

index
リンク
MySQL 8.0 への移行が完了しました～さようなら全ての MySQL 5.7～ - Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは。クラウド運用チームの飯塚です。私たちは cybozu.com 本番環境の MySQL を昨年末から順次 8.0 系へアップグレードしており、前回の定期メンテナンスにおいて全てのインスタンスのアップグレードを完了しました。この記事では、私たちが MySQL 8.0 への移行に取り組んだ理由と必要になった対応について紹介します。なぜ MySQL 8.0 へ移行したのか GTID-based レプリケーションにおける制限の緩和再起動時に AUTO_INCREMENT のカウンタが巻き戻る問題の解消実際に対応が必要だった MySQL 8.0 の変更点 utf8mb4 の照合順序のデフォルト値の変更 SQL_CALC_FOUND_ROWS と FOUND_ROWS() が deprecated に Connector/J のメタデータ取得処理の性能低下 sys.innodb_lo
manabou 2021/05/25
mysql

index

replication
リンク
近似最近傍探索Indexを作るワークフロー - ZOZO TECH BLOG
はじめにこんにちは。ZOZO研究所のshikajiroです。主に研究所のバックエンド全般を担当しています。ZOZOでは2019年夏にAI 技術を活用した「類似アイテム検索機能」をリリースしました。商品画像に似た別の商品を検索する機能で、画像検索と言った方が分かりやすいかもしれません。MLの開発にはChainer, CuPy, TensorFlow, GPU, TPU, Annoy、バックエンドの開発にはGCP, Kubernetes, Docker, Flask, Terraform, Airflowなど様々な技術を活用しています。今回は私が担当した「近似最近傍探索Indexを作るワークフロー」のお話です。 corp.zozo.com 目次はじめに目次画像検索の全体像説明 Workflow Develop Application 推論APIの流れ近似最近傍探索とAnnoy 近似
manabou 2020/06/11
index

api

machinelearning
リンク
ソシャゲエンジニアの自分が開発に必須だなと思った知識（MySQL編） - Qiita
この記事の目的自分は、とある会社様の元でソシャゲの API 開発をさせていただいています。ソシャゲは、リリース時やイベント時などに集中アクセスされやすく、負荷軽減の知識がない状態で開発を行ってしまうと、運用時に緊急メンテ祭りになりやすいジャンルかなと思っています。これまで培ってきた MySQL の知識ですが、脳内メモリ量の関係上、暗記できないのでメモしておこうというのが主目的です。ここ数年ほどソシャゲ開発しかしていないため、偏っている感がある内容ですのでご注意ください。概要ストレージエンジンは InnoDB。メインで扱っている MySQL バージョンは 5.6。記事の内容ですが、これらのキーワードを見て、おおよそ分かる方は読む必要はないかと思います。インデックス系クラスタインデックスカバリングインデックス EXPLAIN で注意するべき値トランザクション系 MVCC
manabou 2019/09/25
api

mysql

game

innodb

database

index
リンク
Service Unavailable
manabou 2018/04/09
filesystem

github

index
リンク
TechCrunch | Startup and Technology News
Unlike Light’s older phones, the Light III sports a larger OLED display and an NFC chip to make way for future payment tools, as well as a camera.
manabou 2017/10/25
bio

ai

paper

index
リンク
B TreeとB+ Treeの違い - Carpe Diem
概要インデックスに対してMongo DBはB Treeを採用し、MySQLのInnoDBはB+ Treeを採用しています。どうして採用しているアルゴリズムが違うのだろう？と思って調べてみました。主な違い B+ TreeはほとんどB Treeと同じですが、以下の点が異なります。リーフノードとリーフノードを結ぶポインタがあるデータはリーフノードのみに保持する具体例言葉だけだと分かりにくいので、Visualizeするツールを使って具体例を表示します。 [1, 2, 3, 4, 5, 6, 8, 10, 15, 18]という数列に対し、Order: 3で作ってみます。 Orderは１ノードから出る枝の数のことです。 B Tree B-Tree Visualization B+ Tree B+ Tree Visualization 先程のB Treeと違って、データはリーフノードに持つの
manabou 2017/05/17
mysql

innodb

tree

btree

algorithm

index
リンク
MySQL with InnoDB のインデックスの基礎知識とありがちな間違い - クックパッド開発者ブログ
こんにちは、サービス開発部の荒引 (@a_bicky) です。突然ですが、RDBMS の既存のテーブルを見てみたら「何でこんなにインデックスだらけなの？」みたいな経験はありませんか？不要なインデックスは容量を圧迫したり、挿入が遅くなったりと良いことがありません。そんなわけで、今回はレコードを検索するために必要なインデックスの基礎知識と、よく見かける不適切なインデックスについて解説します。クックパッドでは Rails のデータベースとして主に MySQL 5.6、MySQL のストレージエンジンとして主に InnoDB を使っているので、MySQL 5.6 の InnoDB について解説します。 InnoDB のインデックスに関する基礎知識インデックスの構造 (B+ 木) InnoDB では B+ 木が使われています。B+ 木は次のような特徴を持った木構造です。次数を b とすると、
manabou 2017/04/18
mysql

innodb

performance

index
リンク
Hash indexes are faster than Btree indexes?
PostgreSQL have supported Hash Index for a long time, but they are not much used in production mainly because they are not durable. Now, with the next version of PostgreSQL, they will be durable. The immediate question is how do they perform as compared to Btree indexes. There is a lot of work done in the coming version to make them faster. There are multiple ways in which we can compare the per
manabou 2017/03/21
postgresql

database

hash

index

btree
リンク
MySQLインデックスのお手入れの基本 | Yakst
Percona Database Performance Blogの翻訳。既に運用を始めたデータベースで、インデックスが正しく使われているか、無駄や不足がないかを確認する方法のまとめ記事。クエリをひとつひとつ確認するのではなく、統計情報を元に判断する分かりやすい方法。このブログ記事では、MySQLインデックスに手入れする基本的なステップについて見ていこうと思います。データベースは、インデックス次第でハイパフォーマンスにも、役立たずで遅くて大変にもなりうることはご存知でしょう。インデックスは、時々手入れをする価値がある非常に重要なものです。それでは、何をチェックすればよいのでしょうか？順不同ですが、確認すべき点を挙げてみます。 1. 使われていないインデックス sysスキーマで、使われていないインデックスをとても簡単に見つけられます。 schema_unused_indexes ビューを
manabou 2016/11/21
mysql

index

performance
リンク
DEXでもうMongoDB職人は要らなくなるの巻 - 256bitの殺人メニュー
※このエントリは個人の見解であり、所属する組織の公式見解ではありませんこのエントリは、Mongo DB Advent Calendar 2015 18日目のエントリです。どうもどうも乙カレー様です。桑野です。 Mongo DB on AWS的ななにかを書こうとしたのですが、その前にこれ紹介したことなかったなーと思いDEXの紹介しようと思います。 DEXとはあのMongo DBならこの人達のMongolabさんの作った、Mongo DBのSlowlogなどから適切なINDEX設定をRecommendしてくれるプロダクトになります。神様仏様Mongolab様。インストール pipで簡単。 $ pip install dex コマンドライン手順基本的には、Mongo DBのURLと、Logのパスを指定していきましょう。 $ dex -f /var/log/mongo db/mongo db.log
manabou 2015/12/19
mongodb

dex

index

slow
リンク
Elasticsearch のインデックスを無停止で再構築する - クックパッド開発者ブログ
こんにちは。ホリデー株式会社の内藤です。ホリデー株式会社では Holiday（https://haveagood.holiday）という新規サービスの開発・運営を行っています。*1 以前投稿した記事でご紹介したように、Holiday では全文検索エンジンとして Elasticsearch を利用しています。 Ruby on Rails で構築されたアプリケーションから Elasticsearch を操作するには、公式 gem である elasticsearch-rails を使うのがとても便利です。もちろん、Holiday でも活用させてもらっています。大方の機能についてはこの gem で提供されるもので満足だったのですが、一点だけ、Holiday の運用をしている中で困ることがありました。それが、サービス公開後のインデックスの再構築です。 elasticsearch-rails
manabou 2015/09/28
elasticsearch

index
リンク
Reddit - Dive into anything
manabou 2015/09/15
map

spatial

index
リンク
ハクビシンにもわかる全文検索 - Qiita
高速な全文検索アルゴリズムであるFM-indexについて解説する。理解しがたい点や間違っている点があれば是非コメントで指摘してほしい。概要 FM-indexはリニアな文字列に対して検索をするアルゴリズムで、主に簡潔データ構造とBWT(およびLF mapping)という二つのアイデアから成り立っている。BWTはBurrows-Wheeler変換のことで、文字列を特殊な並び順に変換するという可逆関数である。BWTされた文字列を簡潔データ構造固有の操作をすることで、クエリ文字列の長さに比例した短い時間で文字列を探し出すのがFM-indexだ。簡潔データ構造簡潔データ構造に関してはFM-indexで必要となる二つの関数だけ説明して、詳細は次の機会に譲るとする。さて、二つの関数はともに文字列のある位置より前の部分に含まれている文字の数を数え上げるというものでrank()とrankLessTha
manabou 2015/07/21
algorithm

bwt

search

index

fm-index
リンク
開発者のためのSQLパフォーマンスの全て
前書き - インデックスの作成はなぜ開発者のタスクなのかインデックスの内部構造 - インデックスは何に似ているかインデックスリーフノード - 二重連結リスト検索ツリー(Bツリー) - バランス木遅いインデックスパートI - インデックスを遅くする2つの原因 where 句 - 検索のパフォーマンスを改善するためにインデックスを作成等価演算子 - 一致するキーの検索プライマリキー - インデックスの使い方を確認複合インデックス - 複数列に対するインデックス遅いインデックスパートII - 前の問題点が再び関数 - where句の中での関数大文字・小文字を区別する検索 - UPPERと LOWER ユーザ定義関数 - 関数インデックスの制限インデックスの作り過ぎ - 冗長性の排除法パラメータ化クエリ - セキュリティとパフォーマンスのために範囲検
manabou 2014/10/20
index

database

document

SQL

performance
リンク
SQLデータベースに正しインデックスを作るのは誰の役割？
SQLのパフォーマンス問題は、SQLそのものと同じぐらいの歴史がある―― ある人は、SQLはそもそも遅いものだとすら言うかもしれません。これは、SQLの歴史が始まった頃は正しかったかもしれませんが、今となっては全く当てはまらないでしょう。にもかかわらず、SQLのパフォーマンス問題は今も一般的でよくあることです。どうしてそうなってしまうのでしょうか？ SQL言語は、恐らく最も成功した第4世代言語(4GL)でしょう。その最大の利点は、「何を」と「どのように」を分離できることです。SQL文は、どのようにそれを実行するかを記述せずに、単純に何を必要としているかのみの記述になっています。以下のような例を考えてみましょう。 SELECT date_of_birth FROM employees WHERE last_name = 'WINAND'SQLのクエリは、データを要求する英語の文として読
manabou 2014/10/18
sql

index

performance

programming
リンク
『MySQL初心者に贈るインデックスチューニングのポイントまとめ2014』
サイバーエージェント公式ブログをご覧の皆さんこんばんは、インフラ＆コアテク本部の須藤(@strsk)です。普段はAmebaのソーシャルゲーム全般のインフラを見つつ、日本語ラップの啓蒙をしながら弊社社員を素材にコラ画像をつくったりしています。好きなAAは麻呂です。はい、というわけで今回はMySQLインデックスチューニングの基本的な流れについてまとめてみました。ソーシャルゲームは更新も参照もめちゃくちゃ多いです。数秒のレプリケーション遅延も致命的なので適切なテーブル、クエリとインデックス設計が重要です。（何でもそうですけど）インデックスが多くなると更新コストなどが懸念されますが、インデックスが正しく使われていないクエリを放置している方が悪です。そんなこんなで、割と例も偏ったりしてるかもしれませんがあしからず。前提としてはInnoDBを想定しています。MyISAMはほとんど使っていません。
manabou 2014/09/18
index

mysql

performance

tuning
リンク
類似度計算と転置Indexとb-Bit Minwise Hashing - Y's note
Recommend Engineでの類似度計算 RecommendEngineを作る時の話。アイテム間の相関を計算する為にユーザーの購買データからJaccard係数やCos類似度を求める手法が一般的です(アイテム×ユーザーTableと、アイテム×アイテム相関Tableが必要)。しかしアイテムの個数(N)×ユーザー数(M)の行列を作り、Nの中から2つのアイテムを取り出してそれぞれの係数や類似度を求め、それを個数分繰り返していたら行列が大きくなる程計算が大変になります。特にアイテムの購買という行為がほとんど発生しないので、購買のベクトルがほとんど0となる疎ベクトルが作られて効率が悪く感じられます。一時期はこれを回避する為にベクトル数を減らす(購買データが多いユーザーに超超限定する)事で回避していたんですが、ユーザーが偏るしデータも少なくなってしまう事を問題として認識していました。そこでデータ数
manabou 2014/08/12
bit

index

hash
リンク
1 2 次のページ