[B! DB] mamorukのブックマーク

MongoDB

General InformationAll DocumentationRealm DocumentationDeveloper Articles & TopicsCommunity ForumsBlogUniversity

mamoruk 2010/06/07

[KVS]

DB

リンク

SSD投入でDBMSのココが変わる! - WEB+DB PRESS vol. 52

SSDを使うとDBMSはどう変わる？徹底検証した記事を書きました！ WEB+DB PRESS Vol.52 予約受付中です。実際に最新最速のSSD、Intel X25-Eを使ってDBMSのパフォーマンスを計測するなど、わくわくしながら記事を書くことができました。SSDの実力に驚きつつも、使い方を間違えるとHDDより遅くなる？など新しい発見もあり。そして、SSDとHDDの違いがどのようにデータベースの性能に影響するのか？ディスク上のデータ構造（ヒープ、B+-treeなど）からバッファ管理など、データベースシステムの中身を解剖してわかりやすく解説しています。読みやすくなったのは丁寧に添削してくださった担当様のおかげです。感謝。ディスクを活用したデータのソーティング（External merge sortなど）に加え、2009年6月にEdgar F. Codd Innovation Aw

mamoruk 2009/08/19

読みたいなー

DB

リンク

Interopクラウドコン優勝は「えとらぼ」分散key-valueストレージ kumofs - Blog by Sadayuki Furuhashi

InteropTokyo 2009 クラウドコンピューティングコンペティション（通称クラウドコン）は、我等がえとらぼチームが優勝しました！実行委員･StarBEDプロジェクト･IBMの皆様を始め関係者の皆様、ありがとうございました。プレゼンテーションムービーとポスターとパンフレット*1を公開しました。プレゼンムービー（マウスクリック/矢印キーで進む） PDF版ポスターパンフレット *2 …どれも相当に気合いが入っているので、ぜひご覧ください^^ Ustream.tvの録画もあります（えとらぼチームはちょっと細切れですが）途中で行ったデモは、StarBEDの45台の物理サーバーを使ってkumofsを動かして、ランダムで選んだノードを自動的にkill/再起動するスクリプトを走らせたものです。サーバーが落ちてもシステムは全然止まらないし、どのサーバーにも均等に負荷が分散されます。時

mamoruk 2009/07/12

確かに気合入っているスライド！

DB

リンク

Não Aqui! » CDB++ 1.0 released

CDB++という，静的ハッシュデータベースライブラリをリリースしました．ライセンスは修正BSDです．静的ハッシュデータベースなので，いったんデータベースを構築したら，要素の追加や削除は行えません．その代わり，コンパクトなデータベース，高速な構築，高速な検索ができるようになっています．データ構造は，Constant Databaseを採用しています．Constant Databaseの実装はいくつかありますが，クロスプラットフォームでお手軽に使えるものがなかったので，作ってみました．また，このライブラリはcdbpp.hというインクルードファイルのみで構成されているので，このファイルをインクルードするだけでアプリケーションに組み込めます．ハッシュデータベースには，Oracle DBやTokyo Cabinetなど，優れた実装がたくさんあります．しかし，単にキーと値のペアをファイルに書き出し

mamoruk 2009/07/10

key-value store ですね！KVS! KVS!

DB

リンク

転置インデックスを実装しよう - mixi engineer blog

相対性理論のボーカルが頭から離れないmikioです。熱いわっふるの声に応えて今回はTokyo Cabinetのテーブルデータベースにおける検索機能の実装について語ってみたいと思います。とても長いのですが、最後まで読んだあかつきには、自分でも全文検索エンジンを作れると思っていただければ嬉しいです。デモモチベーションをあげていただくために、100行のソースコードで検索UIのデモを作ってみました。Java 6の日本語文書を対象としているので、「stringbuffer」とか「コンパイル」とか「倍精度浮動小数」とかそれっぽい用語で検索してみてください。インデックスがちゃんとできていれば、たった100行で某検索エンジン風味の検索機能をあなたのデータを対象にして動かすことができます。ソースコードはこちら（テンプレートはこちら）です。でも、今回はUIの話ではないのです。ものすごく地味に、全文検索

mamoruk 2009/07/03

コードだけでなくドキュメントもたくさん書いて素敵！

mixi
DB

リンク

Leo's Chronicle: データベースシステム入門：「データベースは体育会系図書館？」

（データベースシステムとその研究の世界を一般の人にわかりやすく伝えるため、「図書館」をモデルにした話を書いてみました。試験に出そうな（？）部分は太字で強調してあります。）「データベース」という言葉は、データの集まりという意味です。データベースシステムの研究では、例えて言うなら「欲しい本がすぐに見つかる図書館」をいかに作るかという問題を考えます。ここで「データ」は図書館の「本」に相当し、「ハードディスク」は「本棚」がたくさん収められている図書館の建物だと考えてください。「欲しい本がすぐに見つかる」とはどういうことでしょうか？例えば、図書目録を調べて目的の本棚の番号がわかったとしても、本棚までの距離が遠ければがっかりしてしまいますよね？（高すぎて手が届かない、とか泣けてきます）

mamoruk 2009/05/11

おもしろい! 自分も体育会系自然言語処理ガイド作りたい。いや、自然言語処理は草食系かもしれないが。。。

研究
DB

リンク

PerlとRubyで省メモリなハッシュを使おう - mixi engineer blog

サボっていた早朝ジョギング＠駒沢公園を再開して2週間たち、やっと抜かれる数より抜く数の方が増えてきたmikioです。今回は、PerlやRubyのハッシュの代用としてTokyo Cabinetを使うことでメモリ使用量を激減させられることを説明します。抽象データベースAPI Tokyo Cabinetには抽象データベースという機構があり、先日、そのPerlとRubyのバインディングをリリースしました。それを使うと、各種言語のハッシュとほぼ同じような共通したインターフェイスで、以下のデータ構造を利用することができます。オンメモリハッシュ：各種言語に標準のハッシュと同じく、メモリ上でkey/valueの関係を表現する。オンメモリツリー：メモリ上の二分探索木としてkey/valueの関係を表現する。ファイルハッシュ：いわゆるDBMとして、ファイル上でkey/valueの関係を表現する。ファ

mamoruk 2009/04/24

ほー、スプレー木使っているのか

DB

リンク

Flash-Based DBMSの最前線

フラッシュメモリーを使ったSolid State Drive (SSD)の容量が160GBに到達し、市場価格も下がってきたことにより、ハードディスクの代替品としてSSDを使う用途がいよいよ現実味を帯びてきました。低容量のものなら既にiPodやデジカメ用のメディアなど身の回りにも普及しており、市場ではすでに「破壊的イノベーション（「イノベーションのジレンマ―技術革新が巨大企業を滅ぼすとき」より）」が起こっているといえます。（HDD搭載のWalkmanとか既に滅んでいる例もあるし。。。）

mamoruk 2009/04/16

SSD の利点欠点を冷静に比較。研究は進んでいるのだなー

DB

リンク

バイオのデータベースを使う人、使われる人、使えるのかどうかわからない人。 - ミームの死骸を待ちながら

去る1月23日、AJACS(All Japan Annotator/Curator/System DB administrator)勉強会に参加してきた。 AJACS7 - MotDB 統合データベース講習会：AJACS長津田開催 - 統合ぐらし(2009-01-23) 以前坊農さんのラボ(?)に突入したときのレポートは以下。もう半年近く前なのか...。ライフサイエンス統合DB プロジェクトの中に乗り込んできた - ミームの死骸を待ちながら内容としては、黒川先生と中村先生のプレゼンを挟みつつ、ライフサイエンス統合データベースプロジェクト-統合ホームページ-LSDB ここの使い方を紹介していく形。以下、メモ。スケジュール午前：講演＋講習 10:30-12:30 時間講演者所属題目 10:30-11:00 坊農秀雅ライフサイエンス統合データベースセンター「統合データベースプ

mamoruk 2009/04/07

こういうプロジェクトだとなにが(その分野の中で)すごいのか分からないなぁ

DB

リンク

Neon light: Rx

最近は開発が進んでないのは、PC ゲームしてたというのもありますが、Rxというライブラリを作ったりしてました。ハードウェア設計とは関係ないんですが、文字列をキーに数字を取りだす辞書的な機能を実現していて、ファイルサイズの小ささと、そこそこの高速な検索が特徴です。Txというライブラリの再実装で、若干ファイルサイズが小さくなっています。(ここの読者の方なら、何故Txの再実装がRxという名前かおわかりと思いますが、ネタがわからない人も多かったです) もう一つ、圧縮系のライブラリを作っていて、それが終わったらneon lightの開発に戻る予定です。

mamoruk 2009/04/01

Tx の再実装、これのことか

DB

リンク

SIGMOD2009 Accepted Papers

Yahoo! Researchの"Generating Example Data for Dataflow Programs"は恐らくPig Latinのデバッグ用のサンプルデータ生成の話。Hadoopなどの上で、複雑なデータ構造を動的に組み立てていくプログラム書きながら、横に実行結果の例を「適切に」示したサンプルが表示されると、わかりやすいよね、という話。”Towards a simpler XML Schema: effortless handling of nondeterministic regular expressions”はついに来たか、という感じ。Relational styleの考えが入っていて、スキーマ(relation)から考えられるいろいろな木構造をNFAを使って同時に検証する、という流れだったら嬉しい。"DDE: From Dewey to a Fully Dyn

mamoruk 2009/03/11

MSR, Yahoo!, HP などシリコンバレーのラボが強いと。なるほど〜 Yahoo! Japan 研究所も DB の強い人がいるといいのになぁ

リンク

Shudo's Notes (2009/2) - key-value store 勉強会。

講演タイトル (敬称略): 森大二郎,末永匡: 組み込み型全文検索エンジン groonga - Senna から groonga へ山田浩之: About Lux IO 平林幹雄: Tokyo Cabinet の歴史岡野原大輔: Key (-Value) の効率的な格納手法について前坂徹: memcached 安井真伸: repcached のなかみたけまる: Kai = (Dynamo + memcache API) / Erlang 上野康平: 分散メディアストレージ的ななにか (仮) 古橋貞之: kumofs - kumo fast storage 西澤無我: ROMA のアーキテクチャ首藤一幸: peer-to-peer の方から来ました藤本真樹: Flare のはなし 18:10 開始の予定が実際は 18:30 開始。 20分 x 12件 + 休憩 3回で、23時頃終

mamoruk 2009/02/22

Key-Value Store 勉強会のフォローアップ。

kvs
DB

リンク

blog.katsuma.tv

greeさんで開催されたKey Value Store勉強会に行ってきました。時間にして4時間超え、内容も国内のKey-Value Storeなソフトウェアの最前線の話ばかりで相当なボリューム。以下、メモってたのを残しておきたいと思います。（誤字、脱字、内容に誤りを含むものなどありましたらお伝えください）また、発表者の方やプロダクトについて、ざっくり調べてURL見つけられたものについてはリンク張っています。森さん / 末永さん groonga Sennaの後継エンジン融通が効かないのがSennaのデメリットスコア算出式のカスタマイズなど Sennaの転置索引索引の構成部品を自由に組み合わせて使える APIもいろいろ QL DB Low Level memcached互換のkey-value store バイナリのみ対応計測クライアント　memstorm-0.6.8 mem

mamoruk 2009/02/21

DB

リンク

key/value storageの話 | tabateeの日記 | スラド

key/value storageの話を聞きに行くので、ちょっと予習人によって色々なのを思い浮かべそうなので、思いついたポイントを列挙。速度: 超高速(数十クロック～数百クロック/look up)←→人が見てインタラクティブ←→低速キー: 数値、文字列、バイナリ更新: 不可、高速、低速 lookup: 1 per 1 operation, multiple keys backing store: 無し、ディスク、ネットワーク構成: 1thread, multi threads, cluster 記憶効率: compressed, succinct, 普通, 富豪信頼性：耐タンパ、耐故障(RAMのソフトエラー等)、ACID、特になし例によって何か抜けてるとは思いますが、こんだけ組み合わせがあると既存のものがフィットしないで悩むことも多そうです。SQLサーバが全部をカバーしてく

mamoruk 2009/02/21

DB

リンク

DBMによるテーブルデータベースその五 - mixi engineer blog

ついに発売されたスト4のコンシューマ機版をやりたくてしょうがないけど筐体を買ってもらえないので、駅前のゲーム屋のディスプレー前で垂涎するばかりのmikioです。今回は連載の最終回で、各種スクリプト言語を使ってお手軽にテーブルデータベースを操作する方法について説明します。 TokyoCabinet::TDB まずは、TCのPerlバインディングとRubyバインディングの最新版を入手してください。それぞれテーブルデータベースを扱うための TokyoCabinet::TDB というクラスが加わっています。以下のようなIDLによるガイドラインに準拠したインターフェイスが提供されますので、使い方は言語にかかわらず同じようになるはずです。 module TokyoCabinet { interface TDB { boolean open(in string path, in long omode);

mamoruk 2009/02/17

DB

リンク

MySQLによるデータウェアハウス構築

ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、オークション事業部のWangです。データウェアハウス（以下DWH）という言葉になじみのない方は検索していただいたほうがよいかもしれません。検索するのがめんどい、という方は、かみ砕いた表現ができなくて恐縮ですが、基幹系システムから抽出したデータを目的をもって再構成し、使用可能な状態に保管されたデータの集合体、とお考えください。オークションでは、具体的には出品、入札、落札などのトランザクションデータや、それをいろいろな単位で集計したデータなどが該当します。ここでいう単位というのはたとえば、日ごと、週ごと、月ごとや、以前の記事でも紹介されているカテゴリといったものになります。こういったデータは、運用、運営、

mamoruk 2009/02/10

yahoo
DB

リンク

DBMによるテーブルデータベースその四 - mixi engineer blog

コアライブラリを一生懸命書くとユーティリティやバインディングなどの周辺機能がおろそかになり、逆も然りで、工数割り当てのジレンマが歯がゆいmikioです。今回は余談として、Tokyo Cabinetのテーブルデータベース（TCTDB）を作る途中で思いついた更新機能と性能検証について述べます。アトミックな更新再び TCTDBで好評だったっぽいアトミックな更新機能をその他のデータベースでも実装してみました。例えばハッシュデータベース（TCHDB）では以下の関数が提供されます。 typedef void *(*TCPDPROC)(const void *vbuf, int vsiz, int *sp, void *op); bool tchdbputproc(TCHDB *hdb, const void *kbuf, int ksiz, const char *vbuf, int vsiz,

mamoruk 2009/02/09

DB

リンク

DBMによるテーブルデータベースその参 - mixi engineer blog

最近、忙しさを理由に英会話レッスンをサボりがちになってよろしくないなと猛省するmikioです。今回は、Tokyo CabinetのテーブルデータベースをTokyo Tyrantを使ってデータベースサーバとして利用する方法について述べます。とりあえず使ってみる Tokyo CabinetとTokyo Tyrantの最新版（1.4.4と1.1.12）がリリースされていますので、インストールしておいてください。またも社員名簿を作ってみましょう。まずは、TTのサーバを実行します。データベースファイルの接尾辞には「.tct」を指定して、テーブルデータベースファイルと接続します。 ttserver casket.tct 別の端末でクライアントを操作して、"put" コマンドで社員を登録しましょう。「-sep」は、コラムのキーと値を区切る文字を指定するオプションです。"|" 以外でも任意の区切り文字を

mamoruk 2009/02/02

DB

リンク

ある日のTwitterのタイムラインをまとめてみた

This Page has moved to a new address: kunishi’s blog: ある日のTwitterのタイムラインをまとめてみた Sorry for the inconvenience… Redirection provided by Blogger to WordPress Migration Service

mamoruk 2009/01/30

DB

リンク

DBMによるテーブルデータベースその弐 - mixi engineer blog

インフルエンザで休んだ影響で仕事が鬼のように溜まって消化不良のmikioです（こんな記事を書いている場合じゃない）。さて今回は、Tokyo Cabinetでリレーショナル風データベースを実現したテーブルデータベース（TCTDB）の実装について説明します。 SQLiteとの違いは？ SQLiteはアプリケーション組み込み型のSQL対応リレーショナルデータベースのライブラリです。TCのテーブルデータベースよりもはるかに高機能で、それでいて性能も大変優れています。いわゆるデスクトップアプリケーションに組み込むデータベースをお探しであれば、TCなんかではなく、断然SQLiteがおすすめです。一方で、TCなどのDBMは、より単純なデータ操作をより高速に実行できるように設計および実装されています。典型的なユースケースとして、大規模Webサイトのアカウント管理や、データマイニングに伴う集計操作が挙げら

mamoruk 2009/01/27

DB

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

DBに関するmamorukのブックマーク (22)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス