タグ

分散IOに関するmonjudohのブックマーク (10)

  • Hadoopの解析資料

    オープンソース分散システム「Hadoop」に関する解析資料を公開させて頂いております。この調査はNTTレゾナント株式会社様と共同で行いました(プレスリリース)。 Hadoop解析資料(PDF), 最終更新: 2008/08/25, 公開: 2008/08/25 Hadoopの実際のインストール方法などにつきましては、弊社太田による以下の記事もご参考下さい。 Hadoop、hBaseで構築する大規模分散データ処理システム Hadoopのインストールとサンプルプログラムの実行 複数マシンへHadoopをインストールする

  • Hadoop、hBaseで構築する大規模分散データ処理システム:CodeZine

    はじめに この連載では、大規模分散計算フレームワーク「Hadoop」と、その上につくられた大規模分散データベース「hBase」の仕組みと簡単なサンプルアプリケーションを紹介します。HadoopとhBaseは、Googleの基盤ソフトウェアのオープンソースクローンです。機能やコンセプトについては、Googleが発表している学術論文に依っています。 これらの学術論文によると、Googleでは大規模分散ファイルシステム「Google File System」、大規模分散計算フレームワーク「MapReduce」、大規模分散データベース「BigTable」、分散ロックサービス「Chubby」という4つのインフラソフトウェアが使われています。 図1にGoogleの基盤技術間の依存関係、そしてそれに対応するOSSの対応関係を示しました。まずは対応するGoogleの基盤技術それぞれの機能や特徴をざっくりと

  • P2P分散ストレージ「Cagra」 - Blog by Sadayuki Furuhashi

    id:nyaxt氏との共同開発の分散ストレージ「Cagra」(かぐら)のアルファ版をリリースしました。 cagra α3リリース cagra テクニカルデモ α2リリース 分散ストレージエンジンテクニカルデモ α版リリース cagraのα版試してみたよ - takumalog Cagraは以下のような特徴を持った(目指した)P2P分散ストレージです。 Zeroconf マルチマスタでレプリケーションするWrite 高速な分散Read オプションで高速な非同期Write インターネットレベルよりもLANレベルのマシン台数に特化 巨大データサポート 高速イベント駆動システムコール+軽量スレッド 超アジャ〜イルな開発体制 まだα版で全部が実装されているわけではないですが、とりあえず動きます。 Zeroconf UDPマルチキャストでノードを自動的に発見するので、一切設定ファイルを書かずに動作せる

    P2P分散ストレージ「Cagra」 - Blog by Sadayuki Furuhashi
  • GoogleのBigTableの特長の1つはエンジンとストレージが疎結合であること - llameradaの日記

    GoogleのBigTableの特長の1つはエンジンとストレージが疎結合であることである。 MySQLやPostgreSQLではSQLクエリを受け付けるマシン(エンジン)と、実際にデータを格納するマシン(ストレージ)は同じである。つまり、エンジンとストレージが密結合である。 エンジンとストレージが密結合である利点は、ストレージへのアクセスが、ネットワーク越しの場合に比べて高速なことである。 しかし、この利点は薄れつつある。ディスクへのアクセスはメモリへのアクセスに比べれば遥かに低速である。そのため、ストレージをメモリにキャッシュして運用することが多い。そして、常にストレージをメモリにキャッシュするならば、ストレージがローカルディスクにあるが、ネットワーク越しの別マシンにあろうが大差ない。必要に応じてメモリに読み込むだけである。 GoogleのBigTableではストレージはGFS上に格納さ

    GoogleのBigTableの特長の1つはエンジンとストレージが疎結合であること - llameradaの日記
    monjudoh
    monjudoh 2008/02/22
    『エンジンとストレージが疎結合であることの利点は多い。』
  • たけまる / Amazon's Dynamo is awesome!

    _ Amazon's Dynamo is awesome! [dynamo][distributed][amazon] Amazon の Werner Vogels が発表した Dynamo の論文を (いまさら) 読ん でみたら,いたく感動しました.日語で全体像を解説したページはない ようなので,簡単にですが紹介します. Dynamo について詳しく知りたい方は,論文を読んだときのメモ書き dynamo-memo.txt を置いておくので,参考にし てください. # いつもと違う話題だけど,じつはこっちのが職っぽい [2007-08-30-1] Dynamo というのは,Amazon の膨大なデータを扱う分散 DBM のことで, 毎秒 500 リクエストに対して,99.9% を 300ms 以内にレスポンスするよ うに設計されている.その化け物のようなシステムの概要を紹介する. 一般

  • Gfarm

    Gfarm ファイルシステムは,次世代ネットワーク共有ファイルシステムで, オープンソースソフトウェアで開発が進められています.NFS の代替として, また,より大容量,高信頼,高性能という要求に低コストで応えます. News [08/6/8] Sourceforge.netでCommunity Choice Awards のノミネーションが始まっています.清き一票をよろしくお願いします. [08/5/27] Gfarm version 2.1.0 を公開しました. [07/12/5] 情報処理学会HPC研究会で発表予定の Gfarm v2の論文を公開しました. ソフトウェアダウンロード ドキュメント バグトラッキングシステム メーリングリスト SourceForge プロジェクトページ

  • MogileFSに関して日本語で読める情報 - kinneko@転職先募集中の日記

    読みは「モジャイル」かな? まずは、このへんから。 Learning MogileFS http://www.art-code.org/files/shibuya_pm_tt07_mogilefs_with_catalyst.pdf 分散ファイルシステム MogileFS について http://www.sixapart.jp/techtalk/2006/10/dev_mogilefs.html MogileFS のインストールと初期設定 http://www.sixapart.jp/techtalk/2006/10/dev_mogilefs_install.html MogileFS::Client と MogileFS 内部でのファイルノード管理 http://www.sixapart.jp/techtalk/2006/10/mogilefsclient_mogilefs.html N

    MogileFSに関して日本語で読める情報 - kinneko@転職先募集中の日記
  • Apache Hadoop

    This is the first release of Apache Hadoop 3.4 line. It contains 2888 bug fixes, improvements and enhancements since 3.3. Users are encouraged to read the overview of major changes. For details of please check release notes and changelog. This is a release of Apache Hadoop 3.3 line. It contains 117 bug fixes, improvements and enhancements since 3.3.5. Users of Apache Hadoop 3.3.5 and earlier shoul

    monjudoh
    monjudoh 2007/11/29
    GFSとMapReduceのオープンソース版
  • Roma、Fairyについてひとことふたこと - Blog by Sadayuki Furuhashi

    大規模分散処理向けの国産“ウェブOS”をRubyで開発中 - @ITより。 これはマズイことになった。WikiFormeを作っている内に、VIVER構想の一部が先に実現されてしまいそうだ。 以下、私はこのカンファレンスに行ってもいませんし、とっても浅薄な頭で書いてますので、あまり信用してはいけません。 まずRomaについて。 Romaは、メモリ上にデータを保持した多数のマシンを組み合わせることで、高速で信頼性が高いストレージを実現することを狙う。具体的には、巨大なオンメモリのハッシュ・テーブルをネットワーク上に分散した多数のサーバ上に構築する。P2P(peer-to-peer)ネットワークのルーティング技術として注目されている分散ハッシュ・テーブル(DHT)と似た動作モデルに基づくという。 どうやら、私が作ろうとしていて全然できてない分散ファイルシステムの考えと少し近い。 オンメモリという

    Roma、Fairyについてひとことふたこと - Blog by Sadayuki Furuhashi
    monjudoh
    monjudoh 2007/11/29
    『分散ストレージの代わりに高度なメッセージングで実現してしまうかもしれないErlangはちょっと感動したりもする』←ちょっと気になる
  • 1