つくづくソフトウェア業界を、従来の枠組みだけで見ちゃいけないと思う。 今月の11日だったかな、New York Timesが、Rubyのライブラリをオープンにしたことを発表した。 New York Timesと言えば、Amazon EC2とS3を使って、過去130年分の記事データを、たった一日でPDF化して、かけたコストが滅茶苦茶安かったと評判になった会社。短時間で終わった理由は、Hadoopを使って100台の仮想サーバーをぶんまわしたから。Hadoopの並列処理機構をつかったので、台数が増えると性能が上がるという訳。聞いたところによると、従来の手法を使ったら、完成に数ヶ月かかったとか。しかも、かけたコストは、20万円もしなかったとか。 しかも開発したのは、たった一人のエンジニア。 そんな経験を活かして、ノウハウをRubyで実装し、オープンソースにしたのが、mrtoolkit。 いわゆる大