タグ

2016年7月28日のブックマーク (1件)

  • Apache Spark 2.0正式版がリリース。ANSI SQL標準サポート、10倍以上の高速化など

    Apache Spark 2.0正式版がリリース。ANSI SQL標準サポート、10倍以上の高速化など 分散処理フレームワークの「Apache Spark 2.0」正式版のリリースが、開発元のDatabricksから発表されました。これまでApache Sparkはバージョン1.x(直前の最新版は1.6)でしたので、メジャーバージョンアップとなります。 Spark 2.0で最大の新機能は、新しいSQLパーサーを採用したことによるANSI SQLSQL 2003)への対応です。ビッグデータのベンチマークの1つであるTPC-DSの99種類のクエリがそのまま実行可能と説明されており、プログラマが慣れ親しんだ一般的なSQL文はすべて実行可能になります。 また、DataFrameとDatasetは統合されたAPIとなりました。 こうしたAPIの変更や改善が行われた一方で、Spark 2.0ではパフ

    Apache Spark 2.0正式版がリリース。ANSI SQL標準サポート、10倍以上の高速化など
    legoboku
    legoboku 2016/07/28
    10倍以上の速度向上か