タグ

oReillyとHadoopに関するkana321のブックマーク (10)

  • Cloudera Impala

    大規模並列処理(MPP)エンジンであり、Hadoopのデータに対してSQLを用いてクエリを実行できるソフトウェアImpalaについて紹介する書籍です。ビッグデータのワークフロー全体から、またRDBMS、OS、そしてHadoopといった読者の背景知識を元にして、Impalaが実現する機能や役割を紹介します。なお書はEbook版のみのリリースとなります。 イントロダクション 1章 ビッグデータのエコシステムにおけるImpalaの立ち位置 2章 ビッグデータのワークフローにおけるImpalaの場所 柔軟性 パフォーマンス 3章 RDBMSの背景知識から見たImpala 標準的なSQL ストレージ、ストレージ、ストレージ 数十億行に及ぶデータ Impalaとデータウェアハウスの相似点 Impalaでの初めてのクエリ Impalaのテーブルへのデータの取り込み 4章 UnixあるいはLinuxの背

    Cloudera Impala
  • HBase

    ビッグデータのランダムアクセス系処理に欠かせないHBaseについて、基礎から応用までを詳細に解説。クライアントAPI(高度な機能・管理機能)、Hadoopとの結合、アーキテクチャといった開発に関わる事項や、クラスタのモニタリング、パフォーマンスチューニング、管理といった運用の方法を、豊富なサンプルとともに解説します。日語版ではAWS Elastic MapReduceについての付録を追加。ビッグデータに関心あるすべてのエンジニアに必携の一冊です。 序文 訳者まえがき はじめに 1章 HBaseの紹介 1.1 ビッグデータの夜明け 1.2 リレーショナルデータベースシステムの問題 1.3 非リレーショナルデータベースシステム、Not-Only SQLあるいはNoSQL? 1.3.1 観点 1.3.2 スケーラビリティ 1.3.3 データベースの(非)正規化 1.4 構成要素 1.4.1 背

    HBase
  • Hadoop 第3版

    の名前で親しまれる『Hadoop』の第3版の登場です。今回の改訂では、Hadoop 0.22系、2.x系の記述を大幅加筆。次世代Hadoopの特徴であるYARN(Hadoop 2.x系におけるジョブ実行フレームワーク)やMapReduce 2について詳述しました。Hadoop1.x(旧0.20)の情報もカバーしているので、これまでのバージョンを使う新旧のユーザに対応しています。第3版の日語版付録として、Clouderaの小林大輔氏による「最新の高可用性HDFSの紹介」を掲載。Hadoopの基礎から応用までを網羅し、最新の情報をカバーした書は、Hadoopに関心のあるすべての開発者必携の一冊です。 序 文 訳者まえがき はじめに 1章 Hadoop事始め 1.1 データ! 1.2 データの保管と分析 1.3 他のシステムとの比較 1.3.1 リレーショナルデータベース管理システム 1

    Hadoop 第3版
    kana321
    kana321 2014/11/06
    sponsor:転職ならen派遣ならen Hadoop 第3版
  • Apache Sqoop クックブック

    小さなテストデータセットから巨大な企業データウェアハウスまで、既存のSQLテーブルに蓄積された情報をHDFS(Hadoop Distributed Filesystem)にインポートするためのツールApache Sqoopの使い方を、実例に沿ったレシピとして紹介する書籍です。 Sqoopの導入、さまざまな形式のデータインポート、エクスポートから、Oozie、Hive、HBaseなどと組み合わせて利用する方法などのレシピを収録しています。Hadoopファミリを用いたソフトウェアシステムを構築、運用する上で手元に置いておきたい1冊となるでしょう。なお書はEbook版のみの提供となります。 序文 まえがき 1章 Sqoopの導入 レシピ1.1 Sqoopをダウンロードしてインストールする レシピ1.2 JDBCドライバをインストールする レシピ1.3 専用コネクタをインストールする レシピ1.

    Apache Sqoop クックブック
  • Hadoop 第2版

    「象」の名前で親しまれる『Hadoop』の改訂版です。 Hadoopの基礎から応用までを包括的に解説する初版の充実をそのままに、Pig、HBase、Hive、Sqoop、Avroなどサブプロジェクトセキュリティについても大幅に加筆、より実務に対応できる内容になりました。Hadoop 0.1系に加え、0.2系に関する情報も併記。日語版では「NTTデータの実証事業におけるHadoop活用のポイント」を付録として掲載しています。Hadoopの全体像を網羅し、かつ実践的なトピックを盛り込んだ書は、Hadoopに関心あるすべての人に必携の一冊です。 序文 訳者まえがき はじめに 1章 Hadoop事始め 1.1 データ! 1.2 データの保管と分析 1.3 他のシステムとの比較 1.3.1 RDBMS 1.3.2 グリッドコンピューティング 1.3.3 ボランティアコンピューティング 1.4

    Hadoop 第2版
  • Hadoopオペレーション

    書はHadoopの管理と運用に焦点を当てたです。Hadoopのクラスタ計画から、認証、リソース管理、またクラスタのメンテナンス、モニタリング、バックアップとリカバリなど、Hadoopを使う際に必要なトピックについて網羅しています。日語版ではClouderaの川崎達夫氏と小林大輔氏による「Cloudera Manager」、「Hue」、「高可用性ネームノードのアーキテクチャと動作詳細」についての記事を加筆。ビッグデータの根幹を支えるHadoopの管理と運用について網羅した書は、データ技術者必携の一冊です。 目次 はじめに 1章 イントロダクション 2章 HDFS 2.1 ゴールと動機 2.2 設計 2.3 デーモン群 2.4 データの読み書き 2.4.1 読み取りの流れ 2.4.2 書き込みの流れ 2.4.3 ファイルシステムのメタデータの管理 2.5 高可用性ネームノード 2.6 

    Hadoopオペレーション
    kana321
    kana321 2014/11/05
    Hadoopオペレーション――システム運用管理ガイド
  • Cassandra

    書は、NoSQLミドルウェアの代表格であるCassandraについて包括的に解説する書籍です。Cassandraの概要、インストール、データモデル、データの読み込みと書き込みなどの基礎から、モニタリングやメンテナンス、パフォーマンスチューニングなど、実践的な事柄までをサンプルコードを多用して詳しく解説します。さらに、Hadoopとの連携や、Cassandra以外の非リレーショナルデータベースについてもカバーしています。日語版では、正式リリースされた1.0の基盤であるバージョン0.8を中心に新機能についても収録。Cassandraに関心のある開発者、運用管理者に必携の一冊です。 目次 序文 はじめに 1章 Cassandraとは 1.1 リレーショナルデータベースの何が問題なのか? 1.2 リレーショナルデータベースの簡単な復習 1.2.1 RDBMS:よい点、よくない点 1.2.2 W

    Cassandra
  • プログラミング Hive

    書は、Hadoop上でSQLライクなクエリ操作を可能にするHiveについて、基礎から応用までを詳細に解説した書籍です。データ型とファイルフォーマット、またHiveQLのデータ定義、操作などの基礎的な事柄から、関数、ストリーミング、Thriftサービス、さらにAWSやHCatalogなどの応用まで、Hiveについて必要な事柄を豊富なサンプルとともにわかりやすく解説します。 日語版では、Microsoftの佐藤直生氏による「Windows Azure HDInsight Service」、Clouderaの嶋内翔氏による「Cloudera Impala」、「Hive 0.10 の新機能」、「HiveServer2」を追加。ビッグデータに関心のあるすべてのエンジニア、必携の一冊です。 訳者まえがき はじめに 1章 イントロダクション 1.1 HadoopとMapReduceの概要 1.1.1

    プログラミング Hive
  • ZooKeeperによる分散システム管理

    ZooKeeperは、Apacheソフトウェア財団のオープンソースプロジェクトの1つで、大規模分散システムの協調動作を実現するツール。分散システムが協調動作するために必要なコア機能を提供することで、開発者の負荷を大幅に低減します。HiveやHadoopの新しいスケジューラであるYARNなど、多くのプロジェクト、企業、組織で利用されつつあります。分散システムの協調動作に頭を悩ませていた多くの開発者にとって福音となる、ZooKeeperを使った効果的な分散システムの管理手法、スマートな問題解決法を提示します。 まえがき I部 ZooKeeperのコンセプトと基 1章 はじめに 1.1 ZooKeeperの使命 1.1.1 これまでZooKeeperなしでどうやってきたのか? 1.1.2 ZooKeeperがしてくれないこと 1.1.3 Apacheプロジェクト 1.1.4 ZooKeeper

    ZooKeeperによる分散システム管理
    kana321
    kana321 2014/09/30
    ZooKeeperによる分散システム管理
  • 電子書籍『実践 機械学習』の無料ダウンロードが可能に!

    機械学習の基礎について解説した電子書籍『実践 機械学習 ― レコメンデーションにおけるイノベーション』がHadoop情報サイト「Hadoop Times」から無料でダウンロードできます。 著者は『Mahoutイン・アクション』の著作でもお馴染みのTed DunningとEllen Friedman。Apache Mahoutプロジェクトプロジェクトマネジメント委員やコミッタとして活躍しながら、MapR社でチーフアプリケーションアーキテクトやコンサルタントを務めている両氏が、機械学習の初学者のために書き下ろしたの一冊です。50ページほどの手軽なボリュームながら、レコメンデーションを洗練させるための重要なエッセンスが詰まっています。 機械学習とレコメンデーションについて学習したいけれど、どこから始めればよいか迷っているという方は、手始めに書を読むところから始めてみてはいかがでしょうか。 H

    電子書籍『実践 機械学習』の無料ダウンロードが可能に!
  • 1