大規模分散データ処理フレームワーク「Apache Spark 1.6」正式リリース。メモリコンフィグレーションの自動化、静的型付けのDataset API、速度の向上も実現

テクノロジーカテゴリーの変更を依頼記事元:

www.publickey1.jp

25users がブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

madarax11 大規模分散データ処理フレームワーク「Apache Spark 1.6」正式リリース。メモリコンフィグレーションの自動化、静的型付けのData… - Publickey

2016/01/07 リンク

minonet 大規模分散データ処理フレームワーク「Apache Spark 1.6」正式リリース。メモリコンフィグレーションの自動化、静的型付けのDataset API、速度の向上も実現高速な大規模分散処理のフレームワーク「Apache …

2016/01/06 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

大規模分散データ処理フレームワーク「Apache Spark 1.6」正式リリース。メモリコンフィグレーションの自動化、静的型付けのDataset API、速度の向上も実現

Spark 1.6では、よく使われるデータフォーマットの1つであるParquetの読み込みに、新しいParquet Reader... Spark 1.6では、よく使われるデータフォーマットの1つであるParquetの読み込みに、新しいParquet Readerを導入。いくつかの処理のバイパスやコードの最適化を行った結果、ベンチマークでこれまで1秒あたり290万行の読み込み速度だったものを1秒あたり450万行まで、約50％改善したと説明されています。また、1.6ではこれまで設定により固定されていた実行用のメモリ領域とキャッシュ用のメモリ領域の大きさを、新しいメモリマネージャの導入によって自動的に最適化できるように改善。手動での最適化を不要にし、実行速度の向上に貢献しました。昨年導入された「DataFrame」とJavaVMのオーバーヘッドを改善する実行エンジンの「Project Tungsten」は、Sparkの実行速度の改善に寄与しました。Spark 1.6ではDataFrameを拡張したDataset APIが追

ブックマークしたユーザー

crayzic2016/01/07
madarax112016/01/07
khtno732016/01/07
sonota882016/01/07
terazzo2016/01/07
s_nkmc2016/01/06
cutc-mt2016/01/06
dpprkng2016/01/06
pukuman2016/01/06
Nobeee2016/01/06
nextmedia2016/01/06
minonet2016/01/06
yogasa2016/01/06
Kureduki_Maari2016/01/06
waman2016/01/06
bongkura2016/01/06
hohoho_ho20052016/01/06
yosf2016/01/06

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx