タグ

2014年7月15日のブックマーク (2件)

  • NTTデータが4000コアのクラスターでSparkを試行、NTTドコモからの要望受け

    写真●2014年7月に東京で開催されたHadoopのイベント「Hadoop Conference Japan 2014」で、Sparkの試行結果について発表するNTTデータ基盤システム事業部 システム方式技術ビジネスユニット OSSプロフェッショナルサービスの土橋昌主任 Hadoopによる分散クラスターを使ってビッグデータをインメモリーで高速処理できるソフト「Spark」。このSparkによるビッグデータ処理の試行結果を2014年7月、NTTデータが発表した(写真)。Sparkに注目しているユーザー企業であるNTTドコモからの要望を受け、NTTデータが実利用に近い形で約200台(4000コア)のクラスターでSparkを評価した。Sparkの実証例は世界的にもまだ少なく、先駆的な事例といえる。 Sparkはインメモリー処理が主体のため、Hadoopで一般的な処理方式である「MapReduc

    NTTデータが4000コアのクラスターでSparkを試行、NTTドコモからの要望受け
    msykt
    msykt 2014/07/15
    検証したのスゴイ…“分析アプリケーションの種類にも依存するが、Sparkの設定を詰めるなどの各種チューニング作業を施せば、クラスター全体のメモリー量を超える規模のデータでも概ね実用的に分析できる”
  • Amazon Redshift