Cloud CrowdはRuby製のオープンソース・ソフトウェア。大量のデータを処理しようと思った時にはMapReduceのような仕組みに注目が集まる。テキストのみならず、大量のOCR処理が必要になったり画像をサムネイル化したいといった時にはどのようなシステムを構築するのだが良いだろうか。 Rubyを使って分散処理 一時的に無数のシステムを立ち上げ平行で処理を走らせる時に注目したいのがAmazon EC2だ。以前、ニューヨークタイムズでは1,100万枚を越える画像をPDFに変換するという処理をAmazon EC2のインスタンスを100立ち上げて行ったという事例がある。どうようのシステムを構築するのがCloud Crowdだ。 Cloud Crowdも利用するのはAmazon EC2だ。アクションはRubyで定義するようになっており、テキスト処理のみならず画像変換などの柔軟なシステム処理が可
Datacenter Knowledgeの記事「Amazon EC2 Adding 50,000 Instances A Day « Data Center Knowledge」では、Amazon EC2の新規インスタンス数は1日に5万ずつ増加している、という分析を紹介しています。 その分析はGuy RosenのブログJack of all Cloudsの記事「Anatomy of an Amazon EC2 Resource ID」に掲載されています。 1日に5万インスタンス、1万3000EBSボリュームの増加 Rosen氏は1時間ごとにAmazon EC2のインスタンスやストレージを起動してそのIDを記録する、ということを繰り返し、24時間のあいだにIDがどのように増加していくかを調査しました。その結果、以下の結論にたどり着いたとしています。 50,242 instances requ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く