タグ

hadoopに関するellerのブックマーク (2)

  • リアルタイム分散処理Stormの耐障害性は? - Tech-Sketch

    リアルタイム分散処理とは 「ビッグデータ」処理のためにHadoopを用いますと、「複数のマシンに大量データ処理を分散して飛躍的に性能を向上する」ことが容易に可能となります。 ところがHadoopの弱点としまして、ビッグデータをいったん蓄積し、バッチで一括処理する形態で処理が行われますので、処理データが発生してからそれに対する処理結果が得られるまで必ずタイムラグが発生します。このため、クレジットカードの不正アクセス検知、センサーデータなどでの異常値検出のようなリアルタイムなレスポンス(低レイテンシー)が要求されるビッグデータ分野へのHadoopの適用は向いておりません。 このような随時発生する大量データ(ストリーミングデータ)を、蓄積せずにリアルタイムに処理する「リアルタイム分散処理」が求められています。 今回は、リアルタイム分散処理のソリューションとしてTwitter社より公開された

  • Apache Hadoop 3.4.0 – Apache Hadoop YARN

    Architecture Commands Reference Capacity Scheduler Fair Scheduler ResourceManager Restart ResourceManager HA Resource Model Node Labels Node Attributes Web Application Proxy Timeline Server Timeline Service V.2 Writing YARN Applications YARN Application Security NodeManager Running Applications in Docker Containers Running Applications in runC Containers Using CGroups Secure Containers Reservation

    eller
    eller 2013/10/17
    What is YARN (yet another resource negotiator)
  • 1