タグ

O'Reillyと大規模データ処理に関するkana321のブックマーク (1)

  • Hadoop MapReduce デザインパターン

    TOPICS Database , Java 発行年月日 2011年10月 PRINT LENGTH 210 ISBN 978-4-87311-512-2 原書 Data-Intensive Text Processing with MapReduce FORMAT PDF 大量のデータにアクセスすることによって、商業、科学、コンピューティングといった様々な分野において新たな機会が生み出されています。MapReduceは、巨大なデータセットに対する分散処理を実行するプログラミングモデルであり、安価なサーバーからなるクラスタ上で大規模データの処理を行うためのフレームワークです。 書は、自然言語処理、情報抽出、機械学習などに共通する、テキスト処理のアルゴリズムに重点を置きながら、MapReduceのアルゴリズム設計について解説します。またMapReduceのデザインパターンの概念を説明し、様

    Hadoop MapReduce デザインパターン
    kana321
    kana321 2014/10/01
    Hadoop MapReduce デザインパターン――MapReduceによる大規模テキストデータ処理
  • 1