タグ

ブックマーク / boscoworks.hatenablog.com (1)

  • Hadoop徹底入門を読んだ - boscoworks.log

    初心者なんで、とりあえずパフォーマンスチューニングとかはなしで、概論的なとこだけ。 入門書としてはこれが一番と勧められたので読んだのだけど、とっかかりとしてはなかなか分かりやすかったと思う。 まぁ実際に手を動かさないと何とも分かんないところあるけどね・・・。 第1章 Hadoop ってなんだろう? Hadoop とは 大規模なデータを処理するための並列分散処理基盤 テラバイト・ペタバイトクラスのデータに対して、同じ処理を複数のサーバで同時に処理できる Hadoop の概要 ログ解析、レコメンデーションエンジン、検索エンジンなどで用いられるケースが多い 大規模データ対象のバッチ処理向き Hadoop が提供する機能概要 ハードディスク・ハードウェアを複数並べて同時に利用できる仕組み 分散処理で共通して使う機能 Hadoop の適用領域 RD

    Hadoop徹底入門を読んだ - boscoworks.log
  • 1