タグ

2011年11月19日のブックマーク (3件)

  • 第1回 分散処理を隠蔽し、大規模開発を可能に

    筆者らは、オープンソースソフトウエアの分散処理ミドルウエア「Hadoop」を、基幹系のバッチ処理システムに適用するためのフレームワーク「Asakusa」を開発した。AsakusaはHadoopと同様に、オープンソースソフトウエアとして公開する。公開日は、連載の4回目をお届けする2011年3月31日の予定である。 Asakusaを使うことでHadoopによる分散処理のメリットを享受することが可能となり、これまでRDBMSを利用していた場合と比べて、多くのケースでバッチ処理システムの性能を大幅に向上することができる。筆者らが実際に構築を支援したシステムでは、それまで4時間かかっていた処理が数分で終わるようなケースも出てきている。 盛んに報道されているように、Hadoopはすでに多くの導入実績がある。ただしその用途は、ログ分析システムやレコメンデーションエンジンなどのビジネスインテリジェンス(

    第1回 分散処理を隠蔽し、大規模開発を可能に
  • Eclipse中でAmazon EC2向けJava開発が完結 - @IT

    2009/03/26 米Amazon Web Servicesは3月24日、統合開発環境のEclipse用のプラグイン「AWS Toolkit for Eclipse」を発表し、無償ダウンロード提供を開始した。Apache 2.0ライセンスでオープンソースとして公開していて、バグフィックスなどのパッチや機能追加も受け付けている。 Eclipse中から、Amazon EC2上に任意の数のサーバインスタンスを起動してクラスタとして設定・管理ができるほか、アプリケーションの開発、デプロイ、リモートデバッグまでできるという。Tomcatコンテナの設定・管理も可能。現在、サポートしている開発言語はJavaとTomcatだけだが、ユーザーからのフィードバックを受けながらGlassFishやJBoss、WebSphere、WebLogicなどのアプリケーションサーバや、ほかの言語もサポートしていくとして

  • RubyでHadoopをラップ、分散処理ツールキットが登場 - @IT

    2009/05/12 米新聞社大手のニューヨーク・タイムズは5月11日、Rubyによる大規模分散処理のツールキット「Map/Reduce Toolkit」(MRToolkit)をGPLv3の下にオープンソースで公開したと発表した。MRToolkitは、すでに稼働しているクラスタ上のHadoopと合わせて使うことでRubyで容易にMap/Reduce処理を記述することができる一種のラッパー。処理自体はHadoopが行う。すでにHadoopを使っているユーザーであれば、中小規模のプロジェクトに対して、すぐにMRToolkitを適用可能としている。 デフォルトで有用なMap、Reduceの処理モジュールが含まれていて、数行のRubyスクリプトを書くだけで、例えば膨大なApacheのログからIPアドレス別の閲覧履歴をまとめるといった処理が可能という。独自にMapやReduceの処理を定義することも