showyouのブックマーク / 2014年12月3日

showyou id:showyou

2014年12月3日のブックマーク (2件)

SparkSQL を YARN 上で動作させる - Qiita
本日は Hive on Tez の話をしようと思いましたが，昨日の記事の中でも触れられている Spark かつ SQL on Hadoop である SparkSQL on YARN の話に話題を変更してお届けします． SparkSQL とは名前通り，Spark をランタイムとした SQL インタフェースです．デザインの特徴として，SparkDSL との親和性と，Hive の Metastore, SerDe, UDF 互換性が保たれているという点があげられます．SparkSQL のドキュメントとしては，以下のものがあります: SparkSQL Spark SQL Programming Guide Spark on YARN での HiveQL 互換クエリの動かし方ここからは，Hadoop 2 クラスタを既に持っている方のために，Spark on YARN における Spark の動
showyou 2014/12/03
あとで読む
リンク
Apache SparkでカスタムStreamingする - もょもとの技術ノート
はじめに Spark, SQL on Hadoop etc. Advent Calendar 2014 - Qiita 3日目の記事です。 SparkでカスタムStreamingする方法を紹介します。 TwitterやFlumeなどのSpark Streamingの活用例が下記にあります。 spark/examples/src/main/scala/org/apache/spark/examples/streaming at master · apache/spark · GitHub spark/external at master · apache/spark · GitHub これらは、いろいろ利用できそうですね。一方で、オリジナルのStreaming処理を行いたい場合には、 Sparkが提供するReceiverクラスを拡張する必要があります。この記事では、Receiverクラス
showyou 2014/12/03
spark

あとで読む
リンク
- 2014年12月4日
- 2014年12月3日
- 2014年11月30日