タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

bigdataとsparkに関するyukungのブックマーク (1)

  • Apache Spark チュートリアル

    2015-4-28に東北大学 乾・岡崎研究室でおこなったチュートリアルの資料です。 研究室にはHadoopクラスタ(CDH5.3)があります。実験や実験の前処理といったタスクでそのクラスタを利用するためのチュートリアル、という前提です。 (追記)PMIの計算はもっと実行効率がいい手順があります。という説明を入れ忘れてました。 (追記)PMI計算でIntと書いてある部分は全部Longの間違いでした。

    Apache Spark チュートリアル
  • 1