[B! Spark][DB] wlbhiroのブックマーク

wlbhiro id:wlbhiro

SparkとDBに関するwlbhiroのブックマーク (1)

Apache Spark の JdbcRDD を使ってみた結果 - Qiita
概要前回の投稿で Apache Spark 使ってアクセスログを解析して、CSVファイル出力をやってみましたが、 Apache Spark を使ってアクセスログを解析して、その結果をCSVファイルに出力してみた。今度はアクセスログじゃなくてMySQLのデータを Apache Spark 使って集計出来るかを試してみました。経緯 user 1 --- n entry のようなテーブル関連で各userレコードに関連するentryの数とそのentryのキーなどの情報を知りたくて、またCSVファイル(ｗ)で出力してチーム内で共有しようと思ったのです。ただ、userテーブルのレコード数が80万件近くあり、普通に slick 使った集計スクリプトだと、クソ遅くてやってられん。(← ク○コードだからかも。。) そこで。。分散処理できないかなー ↓ Apache Spark でできないかなー
wlbhiro 2015/08/04
Spark

JDBC

DB

Database
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx