タグ

hadoopとTechTargetに関するwasaiのブックマーク (2)

  • パブリッククラウドのHadoop対応状況を比較する──Amazon、Google、Herokuの場合

    2012年はクラウドの「ビッグデータ」元年といわれており、米Amazon.com、米Google、米Heroku(米Salesforce.com)、米IBM、米Microsoftなどの大手PaaS(Platform as a Service)プレーヤーに注目が集まっている。では、パブリッククラウドでApache Hadoopのインプリメンテーションを最も包括的な形で提供しているのはどのベンダーだろうか。 Apache HadoopはHDFS、MapReduce、Hive、Pigなどのサブコンポーネントとともにビッグデータ分析の主流技術になりつつある。その背景には、エンタープライズデータウェアハウジングにPaaS型クラウドモデルを採用する企業が増えていることがある。Apache Software Foundationは、Hadoopが成熟し、業務用分析クラウド環境として活用できるようになった

    パブリッククラウドのHadoop対応状況を比較する──Amazon、Google、Herokuの場合
  • SQL ServerユーザーのためのHadoop連係入門

    Microsoftが「ビッグデータ」の領域に進出する動きを見せている。同社が狙っているのは、米Googleや米Yahoo!などの企業が創業当初から取り組んでいる膨大な非構造化データの分野だ。例えばGoogleでは、毎日20P(ペタ)バイト(2万Tバイト)のデータを処理しており、その大部分はテキストベースのインデックスファイルの形式だ。しかしビッグデータの種類はインデックスだけではない。企業では大量の電子メール、文書、Webサーバのログ、ソーシャルネットワーキングフィード、その他の各種の非構造化情報を日常的に管理している。 GoogleYahoo!に加え、米Autodesk、米IBM、米Facebookなどの企業では、大量のデータを管理するためにApache Hadoopを採用している。Hadoopは、従来型のツールでは処理できない膨大な非構造化データを管理するためのオープンソースクラウ

    SQL ServerユーザーのためのHadoop連係入門
  • 1