Preferred Infrastructure(PFI)とNTTレゾナントが共同でHadoopに関する調査を行い、その報告書がPDFにて公開されています。 HadoopはGoogleのMapReduce(編注)をJavaで実装したオープンソースプロダクトで、報告書ではGoogleが持っている機能をHadoopではどう実装されているのかを、該当ソースのポインタを含めて記載しています。 Googleの分散ファイルシステムであるGFS(Google File System)は、HadoopではHDFS(Hadoop DistributedFile System)にて実現しています。GFSが提供しているファイルシステム機能のほとんどはHDFSでも提供しています。ただし、調査を行ったHadoop0.16.4では「ファイルのランダム書き込み」と「ファイルのアトミックな追記」は実現できていません(後者