[B! algorithm][database] hiromarkのブックマーク

講義/早稲田大学/データベース特論 - fukudat

早稲田大学大学院理工学研究科コンピュータ・ネットワーク専攻の修士課程向けの講義オンライン分析処理およびデータマイニングについての具体的な研究を取り上げ，研究課題とその解決アプローチを探求する。 2004年度〜2018年度現在継続中後期火曜日 5時限目 2単位教科書 | 参考書 (Suggested Reading) シラバスお知らせ (新しいものが上; Newest comes first) An assignment has been given. 課題を出題しました。 I will cancel Lecture on 2018/12/18. I will cancel Lecture on 2018/11/27. I will cancel Lecture on 2018/11/20. I will cancel Lecture on 2018/11/6. 2018年度

hiromark 2011/02/08

読みたい。

リンク

External sorting - Wikipedia

external sorting algorithm External sorting is a class of sorting algorithms that can handle massive amounts of data. External sorting is required when the data being sorted do not fit into the main memory of a computing device (usually RAM) and instead they must reside in the slower external memory, usually a disk drive. Thus, external sorting algorithms are external memory algorithms and thus ap

hiromark 2009/08/24

リンク

Similarity Joinの話 - ｜ω・)ノ＜黒猫の気まぐれ日記

何か論文読んで，それについて発表するという授業があるのですが，そこでSimilarity Joinについて調べたのでここにメモします．●Similarity Joinって何？すごく大雑把に言うと，類似しているものを結合すること．そのまんまですね．例えば，上図のように4つのタプルがあったら，それぞれ類似しているもの同士でJoinします．普通は閾値を与えて，類似度が閾値以上であれば類似していると判断し，Joinします．#出力の部分は出力例であり，実際には他の組み合わせも出力されうると思います●類似しているってどうやって判断するの？Similarity Joinを行うためには，類似度の高い組み合わせを見つける必要があります．類似度を算出する方法はよく使われる手法がいくつかあります．（Jaccard, cosine, overlapなどなど）他にも，距離という概念でみると，Hamming dist

hiromark 2009/07/29

論文読んでみよ。

リンク

B木 - naoyaのはてなダイアリー

昨年から続いているアルゴリズムイントロダクション輪講も、早いもので次は18章です。18章のテーマはB木(B Tree, Bツリー) です。B木はマルチウェイ平衡木(多分木による平衡木)で、データベースやファイルシステムなどでも良く使われる重要なデータ構造です。B木は一つの木の頂点にぶら下がる枝の本数の下限と上限を設けた上、常に平衡木であることを制約としたデータ構造になります。輪講の予習がてら、B木を Python で実装してみました。ソースコードを最後に掲載します。以下は B木に関する考察です。 B木がなぜ重要なのか B木が重要なのは、B木(の変種であるB+木*1など)が二次記憶装置上で効率良く操作できるように設計されたデータ構造だからです。データベースを利用するウェブアプリケーションなど、二次記憶(ハードディスク)上の大量のデータを扱うソフトウェアを運用した経験がある方なら、いかにディ

hiromark 2009/04/13

B木の python 実装。B木って書くの結構大変なんですよね。。。

リンク

スターバックスは2フェーズコミットを使わない - gregors-ramblings-ja - Google Code

Code Archive Skip to content Google About Google Privacy Terms

hiromark 2009/02/18

面白い。

リンク

インデックスの基礎知識

■ インデックスとはデータベースの世界で、インデックス(索引)とはテーブルに格納されているデータを高速に取り出す為の仕組みを意味します。インデックスを適切に使用することによってSQL文の応答時間が劇的に改善される可能性があります。インデックスにはB-Treeインデックスをはじめ、ビットマップインデックス、関数インデックスなどの種類がありますが、ここでは最も一般的に使われ、かつほとんどのDBMSでサポートされているB-Treeインデックスについて解説します。 ※ CREATE INDEX文でオプションを指定しない場合は通常B-Treeインデックスが作成されます。 ■ B-Treeインデックスのしくみ B-Tree(Balanced Tree)インデックスは次のようなツリー状の構造になっています。ツリーの先頭はヘッダブロックと呼ばれています。ヘッダブロックでは、キー値の範囲

hiromark 2008/12/27

ここらはちゃんと知っておきたい。

リンク

perlによる大規模データの取扱い

本ページでは，perlでどのようにして大規模なデータを保存するかついて説明します．主にスタンドアロンで動くもの (クライアント<->サーバ型でない，いわゆる組込み型) について紹介したいと思います． Menu Berkeley DB BerkeleyDB DB_File SDBM SDBM_File GDBM GDBM_File CDB CDB_File QDBM Depot Curia Villa TDB TDB_File SQLight DBD::SQLite SUFFIX ARRAY SUFARY SARY 複雑なデータ構造 Data::Dumper Storable MLDBM いろいろな比較ファイルサイズ Benchmark Link サンプルデータについて Berkeley DB Berkeley DBは，組み込み向けデータベースです．通常データベースというとOracl

hiromark 2005/03/25

Perl で大規模データを扱うノウハウ。便利です。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (6)

algorithmとdatabaseに関するhiromarkのブックマーク (7)

お知らせ

今週のはてなブックマーク数ランキング（2025年12月第2週）

今週のはてなブックマーク数ランキング（2025年12月第1週）

月間はてなブックマーク数ランキング（2025年11月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス