[B! development][BigData] beth321のブックマーク

beth321 id:beth321

developmentとBigDataに関するbeth321のブックマーク (4)

Apache Spark チュートリアル
2015-4-28に東北大学乾・岡崎研究室でおこなったチュートリアルの資料です。研究室にはHadoopクラスタ（CDH5.3）があります。実験や実験の前処理といったタスクでそのクラスタを利用するためのチュートリアル、という前提です。 (追記)PMIの計算はもっと実行効率がいい手順があります。という説明を入れ忘れてました。 (追記)PMI計算でIntと書いてある部分は全部Longの間違いでした。
beth321 2015/05/03
チュートリアル

OSS

development

()

!!

Spark

あとで読む

apacheSpark

Apache

BigData
リンク
LINE DEVELOPER DAY_2015 Tokyo「ビッグデータを活用するための分析プラットフォーム」レポート #linedevday | DevelopersIO
LINE DEVELOPER DAY_2015 Tokyo「ビッグデータを活用するための分析プラットフォーム」レポート #linedevday こんにちは、虎塚です。昨日は、LINE株式会社さんが開催されたイベントLINE DEVELOPER DAY_2015 Tokyoへ参加してきました。 Taichi Hashimotoさんが講演された「B-5: ビッグデータを活用するための分析プラットフォーム〜データ集計した先に求められる分析技術」を聴きましたので、レポートします。前半は、さまざまOSSを活用して構築された、社内の利用者のニーズに応じたデータ分析基盤の紹介でした。後半は、KPIを人間が見るのでなく、変化を自動検知して通知するシステムを開発中というお話でした。以下、レポートです。データ分析について LINEにとってデータ分析とは何か Collecting: データを集約する
beth321 2015/04/30
LINE

データ

分析

データ分析

あとで読む

Developer

ビッグデータ

bigdata

development

エンジニア
リンク
BigQuery と Google の Big Data Stack 2.0 - naoyaのはてなダイアリー
先日、有志で集まって「BigQuery Analytics」という書籍の読書会をやった。その名の通り Google BigQuery について書かれた洋書。 BigQuery を最近仕事で使い始めたのだが、BigQuery が開発された背景とかアーキテクチャーとかあまり調べもせずに使い始めたので今更ながらその辺のインプットを増やして以降と思った次第。それで、読書会の第1回目は書籍の中でも Overview に相当するところを中心に読み合わせていった。それだけでもなかなかに面白かったので少しブログにでも書いてみようかなと思う。 BigQuery の話そのものも面白いが、個人的には Google のインフラが書籍『Google を支える技術』で解説されたものが "Big Data Stack 1.0" だとして、BigQuery は Big Data Stack 2.0 の上に構築されており
beth321 2014/08/16
development

Google

bigquery

データ

google

bigdata

sql

mpp

nosql

MapReduce
リンク
並列データベースシステムの概念と原理
2014/01/30 筑波大学情報システム特別講義Dの講義資料です。 join関係はNAIST時代の宮崎先生のデータ工学Ⅱの内容を参考にしてます。 animation有効なビデオはこちら https://vimeo.com/85598907Read less
beth321 2014/02/02
database

Hadoop

development

MapReduce

query_processing

db

データベース

concurrent

parallel

bigdata
リンク
1