github → https://github.com/yutapok/-memorandum/blob/master/HighPerformanceSpark.md 翻訳→気になった点のピックアップをしているため、不自然な日本語の箇所があります。 間違いがあればご指摘ください。 まだ途中なので後続の章も都度更新する予定 他の書籍や情報では語られていないことを中心に備忘録として (参考) ← 私の付け足し 書籍 情報 2017出版 Spark version 2.0.1以降〜 OReilly High Perfomance Spark 特徴 比較的新しめの情報 Pure RDDを中心にSparkの内部の動きの理解を深めていく流れ。 読者層は中級者以上を想定しているみたいだが、初級者の方がむしろ読んだ方が良い内容かも。 パフォーマンスのボトルネックとなる要素に絞って要点を説明。 DataFr
![O'Reilly High Performance Spark 備忘録 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/7e2412c73f58dedb507f47e5e279c959134ecd66/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9TyUyN1JlaWxseSUyMCUyMEhpZ2glMjBQZXJmb3JtYW5jZSUyMFNwYXJrJTIwJUU1JTgyJTk5JUU1JUJGJTk4JUU5JThDJUIyJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0zYzIzNjk3YzhhNDllNWFhZjQ1YTlkMDRmNGUwNTg4OA%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQweXV0YXBva2t1biZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YWVlZDIxN2IxZTM4MjI3NDBiODRmOTBlNTg4Y2VlNjc%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D1cef192da55d52673aea03bc76178176)