[B! scala][hadoop] manabouのブックマーク

manabou id:manabou

scalaとhadoopに関するmanabouのブックマーク (3)

GitHub - twitter/scalding: A Scala API for Cascading
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
manabou 2012/01/14
twitter

script

scala

dsl

scalding

hadoop
リンク
Hadoop 完全分散モードで Scala による MapReduce のジョブ実行 - hdfs・mapred コマンドによる手動実行 - なんとなくな Developer のメモ
前回 id:fits:20101010、Scala で実装した MapReduce のコードを完全分散モードで実行してみました。今回は、クラスタ上の全デーモンを起動する start-dfs.sh スクリプトは使わずに、hdfs や mapred を使って NameNode・DataNode、JobTracker・TaskTracker を手動で起動しています。多少不便ですが、こうする事で一般的に紹介されているような SSH の設定等は不要となります。また、完全分散モードで実行する場合、Job オブジェクトに setJarByClass() しておきます。（スタンドアロン実行だけなら不要）ちなみに、setJarByClass を行っていないとリモート側に JAR ファイルを手動で配置する羽目になります。・・・ object MoneyCounter { def main(args:
manabou 2011/06/04
setJarByClass

hadoop

scala
リンク
Scala on Hadoop: Hadoop Conference - stanaka's blog
先日、Hadoop ConferenceでScala on Hadoopというタイトルで発表してきました。スライドを以下に置いておきます。 Scala on HadoopView more presentations from Shinji Tanaka. ダイジェストとして、ScalaをHadoopで動かすための方法を書いておきます。まず、Hadoop上でScalaを実行させるためには、JavaとScalaを接続するライブラリが必要となります。ここでは、SHadoop( http://code.google.com/p/jweslley/source/browse/#svn/trunk/scala/shadoop )を使用します。SHadoopは、型変換を行うシンプルなライブラリです。よくあるWordCountのサンプル、WordCount.scala (http://blog.jo
manabou 2009/11/25
scala

hadoop
リンク
1