タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

Hadoopに関するk_irieのブックマーク (5)

  • 企業で使われるHadoop

    Copyright © 2004-2024 Impress Corporation. An Impress Group Company. All rights reserved.

  • HadoopとRDBMSの比較|大量データのバッチ処理時間短縮はHadoop(ハドゥープ)技術で。

    Hadoop と RDBMS との比較 ■ 使用するのは安価なサーバ ■ ボトルネックが生じにくい構造 ■ 構築コストはRDBMSに比べ1/2以下 ※1 取り扱う規模によって変わります。 ※2 データ①~③はそれぞれ複数保持されている・データは64MBごとに細かく分割されている ■使用するのは高価なサーバ ■台数が増えるほどボトルネックが大きくなる 解消するには ・回線を太くする ・CPUクロックを上げる ・I/O性能をアップする しかし、コストが高くつく。

  • クラウド時代のバッチ処理技術の要、「MapReduce」とは?|大量データのバッチ処理時間短縮はHadoop(ハドゥープ)技術で。

    MapReduceとは?■ MapReduce(マップリデュース)は、元々はGoogleのコンピューティングの中核ソフトウエアでした。 あの名高い検索アルゴリズムは、世界中の人たちが検索をするたびに情報を返すわけですが、 業界随一の高速性を実現しているカギが、このMapReduce(マップリデュース)にあります。 まず、1つのタスクを何百、何千の細かいタスクに分割し、それらを多数のコンピューターに割り当てます。 そして、各コンピューターから瞬時に戻された情報を再構成し、最終的に1つの回答を導きだすのです。 似たようなプログラムはほかにもありますが、大規模データ処理のバッチ処理においては、 MapReduce(マップリデュース)こそが最も高速で、しかもタスク量の制限はほぼないと言えます。 MapReduce(マップリデュース)そのものはGoogle独自のものであり、社外持ち出しは禁

  • バッチ処理時間の短縮を実現するHadoop技術とは?(その2)|大量データのバッチ処理時間短縮はHadoop(ハドゥープ)技術で。

    Hadoop(ハドゥープ)とは、Googleの分散ファイルシステムを応用して オープンソース化したプラットフォームです。 分散ファイルシステムとは、複数のマシンのディスクを組み合わせて 1つのファイルシステムとして見せる技術です。 これは1つのディスクで保存しきれないような大量のデータを並列化することで 非常に高速に効率良く処理することができるのです。 Hadoopプラットフォームは安全です。 分散ファイルシステムにより、同じファイルを異なるマシンに重複して持たせることで、 一台のマシンが故障した場合でもファイルが失われません。 つまり、耐障害性の高い・安全性の高いとプラットフォームであると言えるのです。 Hadoopプラットフォーム、始まりはGoogleから・・・ グーグルが独自に開発したMapReduceは、 同社の検索エンジンを支える中核技術であるため詳細は未公開ですが、

  • Hadoopとは?|Littel-hadoop

    Hadoop(ハドゥープ)とは、Googleの分散ファイルシステムを応用して オープンソース化したプラットフォームです。 分散ファイルシステムとは、複数のマシンのディスクを組み合わせて 1つのファイルシステムとして見せる技術です。 これは1つのディスクで保存しきれないような大量のデータを並列化することで 非常に高速に効率良く処理することができるのです。 Hadoopプラットフォームは安全です。 分散ファイルシステムにより、同じファイルを異なるマシンに重複して持たせることで、 一台のマシンが故障した場合でもファイルが失われません。 つまり、耐障害性の高い・安全性の高いとプラットフォームであると言えるのです。 Hadoopプラットフォーム、始まりはGoogleから・・・ グーグルが独自に開発したMapReduceは、 同社の検索エンジンを支える中核技術であるため詳細は未公開ですが、

  • 1