Apache HadoopとSparkの違いとは? 分散処理フレームワークを基礎からわかりやすく解説! Hadoopは処理能力の拡張性・安定性が高い Hadoopは米Yahoo!社に所属していたDoug Cutting氏を中心として2006年に開発された分散処理フレームワークです。2004年Googleが論文にて発表した独自の分散処理フレームワークMapReduceをもとに生み出されました。ちなみに名前の由来はDoug氏の息子が持っていたゾウの人形です。 Hadoopのメリットはまずサーバーの台数に比例して処理能力を高められる、いわゆるスケールアウトが可能だということ。Web上のビッグデータはどんどん増え続けます。そんなときHadoopを実装していればコストを押さえつつ対応し続けられるのです。 また、安定性が高いのも魅力のひとつ。どこか一つのサーバーで障害が起こってもほかのサーバーが対応す
![Apache HadoopとSparkの違いとは? 分散処理フレームワークを基礎からわかりやすく解説!](https://cdn-ak-scissors.b.st-hatena.com/image/square/1a8955ba4869b925338e97b4dda078076adddec3/height=288;version=1;width=512/https%3A%2F%2Fdata.wingarc.com%2Fwp-content%2Fuploads%2F2019%2F07%2FGettyImages-1137967967-e1563959492527.jpg)