タグ

O'Reillyとmapreduceに関するkana321のブックマーク (5)

  • HBase

    ビッグデータのランダムアクセス系処理に欠かせないHBaseについて、基礎から応用までを詳細に解説。クライアントAPI(高度な機能・管理機能)、Hadoopとの結合、アーキテクチャといった開発に関わる事項や、クラスタのモニタリング、パフォーマンスチューニング、管理といった運用の方法を、豊富なサンプルとともに解説します。日語版ではAWS Elastic MapReduceについての付録を追加。ビッグデータに関心あるすべてのエンジニアに必携の一冊です。 序文 訳者まえがき はじめに 1章 HBaseの紹介 1.1 ビッグデータの夜明け 1.2 リレーショナルデータベースシステムの問題 1.3 非リレーショナルデータベースシステム、Not-Only SQLあるいはNoSQL? 1.3.1 観点 1.3.2 スケーラビリティ 1.3.3 データベースの(非)正規化 1.4 構成要素 1.4.1 背

    HBase
  • Hadoop 第3版

    の名前で親しまれる『Hadoop』の第3版の登場です。今回の改訂では、Hadoop 0.22系、2.x系の記述を大幅加筆。次世代Hadoopの特徴であるYARN(Hadoop 2.x系におけるジョブ実行フレームワーク)やMapReduce 2について詳述しました。Hadoop1.x(旧0.20)の情報もカバーしているので、これまでのバージョンを使う新旧のユーザに対応しています。第3版の日語版付録として、Clouderaの小林大輔氏による「最新の高可用性HDFSの紹介」を掲載。Hadoopの基礎から応用までを網羅し、最新の情報をカバーした書は、Hadoopに関心のあるすべての開発者必携の一冊です。 序 文 訳者まえがき はじめに 1章 Hadoop事始め 1.1 データ! 1.2 データの保管と分析 1.3 他のシステムとの比較 1.3.1 リレーショナルデータベース管理システム 1

    Hadoop 第3版
    kana321
    kana321 2014/11/06
    sponsor:転職ならen派遣ならen Hadoop 第3版
  • Hadoopオペレーション

    書はHadoopの管理と運用に焦点を当てたです。Hadoopのクラスタ計画から、認証、リソース管理、またクラスタのメンテナンス、モニタリング、バックアップとリカバリなど、Hadoopを使う際に必要なトピックについて網羅しています。日語版ではClouderaの川崎達夫氏と小林大輔氏による「Cloudera Manager」、「Hue」、「高可用性ネームノードのアーキテクチャと動作詳細」についての記事を加筆。ビッグデータの根幹を支えるHadoopの管理と運用について網羅した書は、データ技術者必携の一冊です。 目次 はじめに 1章 イントロダクション 2章 HDFS 2.1 ゴールと動機 2.2 設計 2.3 デーモン群 2.4 データの読み書き 2.4.1 読み取りの流れ 2.4.2 書き込みの流れ 2.4.3 ファイルシステムのメタデータの管理 2.5 高可用性ネームノード 2.6 

    Hadoopオペレーション
    kana321
    kana321 2014/11/05
    Hadoopオペレーション――システム運用管理ガイド
  • スケーリングMongoDB

    スケーラブルかつハイパフォーマンスなNoSQLデータベースであるMongoDBに関する書籍です。書では、アプリケーションが直面するデータの増大に対応するため、MongoDBクラスタを構築するための知識を紹介します。シャーディングによるMongoDBクラスタの構築方法、クラスタを効率よく用いるデータ構造の選択方法、監視やバックアップなどの管理方法までを解説します。書はEbook版のみの販売となります。 はじめに 書で使用されている表記規則 サンプルコードの利用について 書に関するお問い合わせ 1章 分散コンピューティングへようこそ! シャーディングとは何か 2章 シャーディング データの分割 バランシング configサーバー クラスタの構造 3章 クラスタのセットアップ シャードキーの選択 新規あるいは既存のコレクションのシャーディング 容量の追加・削除 4章 クラスタの扱い クエ

    スケーリングMongoDB
  • Hadoop MapReduce デザインパターン

    TOPICS Database , Java 発行年月日 2011年10月 PRINT LENGTH 210 ISBN 978-4-87311-512-2 原書 Data-Intensive Text Processing with MapReduce FORMAT PDF 大量のデータにアクセスすることによって、商業、科学、コンピューティングといった様々な分野において新たな機会が生み出されています。MapReduceは、巨大なデータセットに対する分散処理を実行するプログラミングモデルであり、安価なサーバーからなるクラスタ上で大規模データの処理を行うためのフレームワークです。 書は、自然言語処理、情報抽出、機械学習などに共通する、テキスト処理のアルゴリズムに重点を置きながら、MapReduceのアルゴリズム設計について解説します。またMapReduceのデザインパターンの概念を説明し、様

    Hadoop MapReduce デザインパターン
    kana321
    kana321 2014/10/01
    Hadoop MapReduce デザインパターン――MapReduceによる大規模テキストデータ処理
  • 1