2015-03-21 #TokyoWebmining 44th の発表資料です。
NECマネジメントパートナー株式会社(代表取締役執行役員社長 松倉 肇、本社:神奈川県川崎市、以下NECマネジメントパートナー)は、本格的なビッグデータ時代の到来に備え、オープンソースの分散プロセス実行環境であるApache Sparkのトレーニング2コースを11月25日から順次開講いたします。 オープンソースの分散プロセス実行環境であるApache SparkはApache Hadoopを補完して、従来のバッチ指向の方法に対し、バッチ処理/ストリーム処理の統合による大量データの高速処理を実現することで、ビッグデータアプリケーションやエンドユーザーの期待に応えるデータの高速なインタラクティブ分析を可能にします。ビッグデータの隆盛に備え、NECマネジメントパートナーでは早くからトレーニングコースを提供してまいりましたが、今回、オリジナルコースである「Apache Spark 概要」(1日間コ
こんにちは。 Kafkaを試している最中で微妙ですが、最近使えるのかなぁ、と情報を集めているのが「Apache Spark」です。 MapReduceと同じく分散並行処理を行う基盤なのですが、MapReduceよりも数十倍速いとかの情報があります。 ・・・んな阿呆な、とも思ったのですが、内部で保持しているRDDという仕組みが面白いこともあり、 とりあえず資料や論文を読んでみることにしました。 まず見てみた資料は「Overview of Spark」(http://spark.incubator.apache.org/talks/overview.pdf)です。 というわけで、読んだ結果をまとめてみます。 Sparkとは? 高速でインタラクティブな言語統合クラスタコンピューティング基盤 Sparkプロジェクトのゴールは? 以下の2つの解析ユースケースにより適合するようMapReduceを拡張
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く