5. Apache Sparkの概要 ■ OSSのインメモリ処理の分散並列基盤. ■ RDDという分散コレクションに対して, map, filter, reduceなどのデータ処理を繰り返して 目的のデータを得る処理モデル. ※ RDD: Resilient Distributed Dataset ■ 2009年,UC Berkeley(当時)のMatei Zaharia氏が 関数プログラミング言語Scalaを用いて開発. 5 6. Apache Sparkの概要 ■ Sparkのコアとなる分散処理エンジン (Apache Spark Core) ■Spark SQL: SparkのアプリでSQL ■Spark Streaming: ストリーム処理 ■MLlib: 機械学習 ■GraphX: グラフの処理 6
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く