[B! algorithm][database] jjzakのブックマーク

jjzak id:jjzak

algorithmとdatabaseに関するjjzakのブックマーク (8)

Oracle の B*Tree インデックスの内部構造についてお勉強中（その１）
お仕事のデータベース一式のリース切れ間近ということで、リース延長で耐えることができるのか、それともシステム更改が必要なのかを見極めるため、最近はデータベース周りのチューニングばかりやってます。当初設計時に、５年間持つ設計をしたのですが、流石に５年目にもなると予定とはそれなりに乖離が発生するものです。テーブル＆インデックス設計をユーザ向けの処理をとにかく高速に処理できるように設計したので、ユーザ向けの処理は速度的に全然大丈夫なのですが、データの肥大化によるバッチ処理のパフォーマンス劣化が顕著です。単純にストレージと CPU パワーが足りていないのでしょう。しかしながらチューニングの余地はまだまだ十分にありそうです。バッチ向けの最適化を図ることにしました。うまくいけば来年度どころか、後数年はリース延長で延命できるかもしれません。今回実施したチューニングの１つのポイントとして、バッチ処理向
jjzak 2009/11/14
database

development

db

algorithm
リンク
BrewersCapTheorem - ブリュワーの CAP 定理
BrewersCapTheorem - ブリュワーの CAP 定理目次この文書についてブリュワーの CAP 定理 - Amazon と eBay のクールエイドブリュワーの(CAP)定理一貫性 (Consistency) 可用性 (Availability) 分割耐性(Partition Tolerance) 定理の重要性図解で証明 CAP と折り合う 1. 分割耐性を諦める 2. 可用性を諦める 3. 一貫性を諦める 4. BASE に跳ぶ 5. 問題をかわして設計するまとめ参考文献ブリュワーの CAP 定理この文書について "Brewer's CAP Theorem - The kool aid Amazon and Ebay have been drinking" の日本語訳です. http://www.julianbrowne.com/article/view
jjzak 2009/09/19
database

cap

algorithm
リンク
perlによる大規模データの取扱い
本ページでは，perlでどのようにして大規模なデータを保存するかついて説明します．主にスタンドアロンで動くもの (クライアント<->サーバ型でない，いわゆる組込み型) について紹介したいと思います． Menu Berkeley DB BerkeleyDB DB_File SDBM SDBM_File GDBM GDBM_File CDB CDB_File QDBM Depot Curia Villa TDB TDB_File SQLight DBD::SQLite SUFFIX ARRAY SUFARY SARY 複雑なデータ構造 Data::Dumper Storable MLDBM いろいろな比較ファイルサイズ Benchmark Link サンプルデータについて Berkeley DB Berkeley DBは，組み込み向けデータベースです．通常データベースというとOracl
jjzak 2009/08/02
programming

tips

software

database

perl

suffixarray

text

search

algorithm
リンク
サービス終了のお知らせ
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
jjzak 2009/07/12
programming

tips

mysql

sql

database

db

algorithm
リンク
MapReduce - naoyaのはてなダイアリー
"MapReduce" は Google のバックエンドで利用されている並列計算システムです。検索エンジンのインデックス作成をはじめとする、大規模な入力データに対するバッチ処理を想定して作られたシステムです。 MapReduce の面白いところは、map() と reduce() という二つの関数の組み合わせを定義するだけで、大規模データに対する様々な計算問題を解決することができる点です。 MapReduce の計算モデル map() にはその計算問題のデータとしての key-value ペアが次々に渡ってきます。map() では key-value 値のペアを異なる複数の key-value ペアに変換します。reduce() には、map() で作った key-value ペアを同一の key で束ねたものが順番に渡ってきます。その key-values ペアを任意の形式に変換すること
jjzak 2008/05/18
algorithm

database

development

mapreduce

programming
リンク
ブロックアルゴリズムとB-Treeアルゴリズム
ファイルサーチを高速化するB-Treeアルゴリズム ext2、ext3がベースとするブロックアルゴリズムは、ブロック数が対応するディスクのジオメトリ数に制限されること、ファイルサーチにO（n）かかる（注）こと、ファイルサイズに関係するパフォーマンス低下など、いくつかの問題があった。注：「O（n）」とは、実行時間が入力の大きさ「n」に比例するアルゴリズムである。O（n）は「nのオーダー」または「オーダーn」と読む。後述する「O（log n）」は、アルゴリズムの計算量に関する議論の場合logの底は常に2で、O（log n）の方がO（n）よりも効率が良い。例えばn＝8の場合、O（log n）は入力8に対して3回の実行で済むが、O（n）は8回の実行となる。 ReiserFS、JFS、XFSといったファイルシステムでは、こうしたブロックアルゴリズムの限界に対して、早い段階からデータベースの技術をフ
jjzak 2007/08/23
B-Treeアルゴリズム

algorithm

database

linux

programming
リンク
インデックスの基礎知識
■ インデックスとはデータベースの世界で、インデックス(索引)とはテーブルに格納されているデータを高速に取り出す為の仕組みを意味します。インデックスを適切に使用することによってSQL文の応答時間が劇的に改善される可能性があります。インデックスにはB-Treeインデックスをはじめ、ビットマップインデックス、関数インデックスなどの種類がありますが、ここでは最も一般的に使われ、かつほとんどのDBMSでサポートされているB-Treeインデックスについて解説します。 ※ CREATE INDEX文でオプションを指定しない場合は通常B-Treeインデックスが作成されます。 ■ B-Treeインデックスのしくみ B-Tree(Balanced Tree)インデックスは次のようなツリー状の構造になっています。ツリーの先頭はヘッダブロックと呼ばれています。ヘッダブロックでは、キー値の範囲
jjzak 2006/11/06
database

db

sql

algorithm
リンク
データベースシステムにおける遺伝的問い合わせ最適化
複雑な最適化問題としての問い合わせ応答処理全てのリレーショナル演算子の中で、処理や最適化が最も難しいものは join です。問い合わせ中の join の数が多くなるにしたがって、それに応答するために取り得る計画の数が指数的に増えていきます。個々の join や、リレーションへのアクセス経路としての多種のインデックス（例えば、 Postgres における、r-tree、b-tree、ハッシュ）を処理するための多様な結合方法（例えば、 Postgres における、入れ子状ループ、インデックススキャン、マージ結合）をサポートすることは、更なる最適化の改良を引き起こします。現在の Postgres オブティマイザの実装は、代替ストラテジ空間に対するしらみつぶし検索です。この程度の問い合わせ最適化技術では、人工知能のような大規模な問い合わせを必要とするデータベースアプリケー
jjzak 2006/11/06
database

db

sql

algorithm
リンク
1