タグ

分散に関するwatanata2000のブックマーク (5)

  • RubyでHadoopをラップ、分散処理ツールキットが登場 - @IT

    2009/05/12 米新聞社大手のニューヨーク・タイムズは5月11日、Rubyによる大規模分散処理のツールキット「Map/Reduce Toolkit」(MRToolkit)をGPLv3の下にオープンソースで公開したと発表した。MRToolkitは、すでに稼働しているクラスタ上のHadoopと合わせて使うことでRubyで容易にMap/Reduce処理を記述することができる一種のラッパー。処理自体はHadoopが行う。すでにHadoopを使っているユーザーであれば、中小規模のプロジェクトに対して、すぐにMRToolkitを適用可能としている。 デフォルトで有用なMap、Reduceの処理モジュールが含まれていて、数行のRubyスクリプトを書くだけで、例えば膨大なApacheのログからIPアドレス別の閲覧履歴をまとめるといった処理が可能という。独自にMapやReduceの処理を定義することも

    watanata2000
    watanata2000 2010/02/08
    Hadoop MRToolkit NYTimes New York Times
  • Hadoopとは?|Littel-hadoop

    Hadoop(ハドゥープ)とは、Googleの分散ファイルシステムを応用して オープンソース化したプラットフォームです。 分散ファイルシステムとは、複数のマシンのディスクを組み合わせて 1つのファイルシステムとして見せる技術です。 これは1つのディスクで保存しきれないような大量のデータを並列化することで 非常に高速に効率良く処理することができるのです。 Hadoopプラットフォームは安全です。 分散ファイルシステムにより、同じファイルを異なるマシンに重複して持たせることで、 一台のマシンが故障した場合でもファイルが失われません。 つまり、耐障害性の高い・安全性の高いとプラットフォームであると言えるのです。 Hadoopプラットフォーム、始まりはGoogleから・・・ グーグルが独自に開発したMapReduceは、 同社の検索エンジンを支える中核技術であるため詳細は未公開ですが、

    watanata2000
    watanata2000 2010/02/08
    Hadoop 説明
  • 【IT用語】MapReduceとHadoop

    IT用語】MapReduceとHadoop 金 裕可里, 木田 直人, 三木光範, 廣安知之 ISDL Report  No. 20091306001 2009年 7月 2日 1  はじめに 近年, Webページの検索や, 地図の検索を行うためにGoogleのサービスが頻繁に利用されており, 必要不可欠なものとなっている.Web検索は, 莫大なデータを扱うのにも関わらず, 瞬時に検索結果を表示させることを実現している. この事実の裏側では, 想像以上に膨大な計算や多数のコンピュータの働きがある. Googleはその超巨大なコンピュータネットワークを用いて, 膨大なデータ処理を分散化している. そのため, 大量のデータを瞬時に処理することが可能になっている. そのGoogleの分散処理システムはMapReduce[1]と呼ばれており, Googleの検索技術を支えるコア技術である.

    watanata2000
    watanata2000 2010/02/08
    MapReduce Hadoop 仕組み 解説
  • 分散KVS「kumofs」、元ミクシィCTO設立のえとらぼがOSSとして公開

    えとらぼは2010年1月18日、分散キー・バリュー型データストア(KVS)の「kumofs(クモエフエス)」をオープンソース・ソフトウエア(OSS)として公開した。えとらぼは、SNS(ソーシャル・ネットワーキング・サービス)mixiを開発した元ミクシィCTO(最高技術責任者)の衛藤バタラ氏(関連記事)が設立したベンチャー企業である。 分散KVSは、大量のデータを多数のサーバーに分散して保持するための基盤ソフトウエア。kumofsは、えとらぼが運営する写真ストレージサービス「Ficia」で使用している。また、InteropTokyo 2009 クラウドコンピューティングコンペティション(クラウドコン)で優勝したソフトウエアでもある(関連記事)。データの複製を複数サーバーで保持することで、一部のサーバーに障害が発生してもサービスを継続できる。またサービスを止めることなくサーバーの追加や交換もで

    分散KVS「kumofs」、元ミクシィCTO設立のえとらぼがOSSとして公開
  • 楽天製。Rubyベースの分散型キー/バリューDB·ROMA MOONGIFT

    ROMAはRuby製のオープンソース・ソフトウェア。Webシステムで一般的に使われているRDBMSに対してここ一、二年で注目を集めているのがキー/バリュー型のデータベースシステムだ。シンプルに使えてスケールしやすく、大型のWebシステムでは導入が当たり前になりつつある。 そんなキー/バリュー型データベースとして有名なのはmemcachedやMogileFSなどが知られている。そこに独自のデータベースを開発したのが楽天だ。Ruby開発者であるまつもと氏をフェローに迎えて開発されたのがROMAになる。もちろんRubyで開発されておりごく手軽に利用できる。 ROMAはRuby1.9を使って動作する。インストールは簡単にでき、複数のインスタンスを簡単に立ち上げられる。そしてクライアントからはmemcachedと同様に接続が可能で、telnetでも接続することが可能だ。P2Pをもとして分散システムに

    楽天製。Rubyベースの分散型キー/バリューDB·ROMA MOONGIFT
    watanata2000
    watanata2000 2009/12/11
    まつもとさんが作ったって話だし、楽天サイトで利用されてるんなら、使ってみる価値高いなぁ 。。。
  • 1