BigFatCatのブックマーク / 2017年1月31日 - はてなブックマーク

BigFatCat id:BigFatCat

2017年1月31日のブックマーク (7件)

Apache Sparkにおけるメモリ - アプリケーションを落とさないメモリ設計手法 -
- Apache Spark is an open-source cluster computing framework for large-scale data processing. It was originally developed at the University of California, Berkeley in 2009 and is used for distributed tasks like data mining, streaming and machine learning. - Spark utilizes in-memory computing to optimize performance. It keeps data in memory across tasks to allow for faster analytics compared to dis
BigFatCat 2017/01/31
sparkのメモリ管理について。凄く詳しくて参考になる。

spark

slide
リンク
Avro vs. Parquet
BigFatCat 2017/01/31
カラムが沢山あるデータはparquetがよさそう。

parquet

avro
リンク
REJECT vs DROP when using iptables
BigFatCat 2017/01/31
iptables
リンク
Spark DataframeのSample Code集 - Qiita
はじめに：Spark Dataframeとは Spark Ver 1.3からSpark Dataframeという機能が追加されました。特徴として以下の様な物があります。 Spark RDDにSchema設定を加えると、Spark DataframeのObjectを作成できる Dataframeの利点は、 SQL風の文法で、条件に該当する行を抽出したり、Dataframe同士のJoinができる filter, selectというmethodで、条件に該当する行、列を抽出できる groupBy → aggというmethodで、Logの様々な集計ができる UDF(User Defined Function)で独自関数で列に処理ができる SQLで言うPivotもサポート (Spark v1.6からの機能) つまり、RDDのmapやfilterでシコシコ記述するよりもSimple Codeで、且つ高
BigFatCat 2017/01/31
spark

parquet
リンク
How to convert a JSON file to parquet using Apache Spark?
BigFatCat 2017/01/31
parquet
リンク
ApacheCon BigData Europe 2016 - Parquet in Practice & Detail.key
BigFatCat 2017/01/31
parquet
リンク
Spark 2.x Troubleshooting Guide
From common errors seen in running Spark applications, e.g., OutOfMemory, NoClassFound, disk IO bottlenecks, History Server crash, cluster under-utilization to advanced settings used to resolve large-scale Spark SQL workloads such as HDFS blocksize vs Parquet blocksize, how best to run HDFS Balancer to re-distribute file blocks, etc. you will get all the scoop in this information-packed presentati
BigFatCat 2017/01/31
p.7がこのエラーが出た際の対処方：→"java.lang.OutOfMemoryError: GC overhead limit exceeded"

spark

tuning

performance
リンク
- 2017年2月1日
- 2017年1月31日
- 2017年1月30日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx