Prestogres provides ODBC & JDBC connectivity to Presto, a distributed SQL query engine. Presto meetup @ Facebook (2014-05-14)Read less
Presto: Past, Present, and Future In the talk we discuss the progress since Presto was open sourced, what the Presto team is working on now, and what we will be working on over the next year. See more at https://prestosql.ioRead less
2. はじめに • Profile – Yoshihiko Miyaichi – General Manager, Platform Strategy cyber communications inc. – Facebook, Twitter, LinkedIn: miyaichi • Session Agenda 想定オーディエンス: 代理店の方や、3PASを实施している方 内容:MediaMindをはじめとする3PAS(第三者配信)は、複数の媒体出 稿効果を理解するのに有効な手段である。しかしながら、深い分析を するには、大量のフィードデータ処理が必要で、ハードルが高い。 しかし、AWSとTRESURE DATAのサービスを組み合わせて分析環境を 構築すれば、大量のデータを安価に高速に簡単に扱えるようになる。 3. MediaMind data feed • 3PAS(第三者配信)サー
This document discusses scaling ETL processes with Hadoop. It describes using Hadoop for extracting data from various structured and unstructured sources, transforming data using MapReduce and other tools, and loading data into data warehouses or other targets. Specific techniques covered include using Sqoop and Flume for extraction, partitioning and tuning data structures for transformation, and
3. Scaling an engineering organization • Adding an engineer to an organization has known drag: • Life-related problems (illness, life events, etc.) will grow linearly with people • Communication- and organization-related problems will grow non-linearly with people • The drag is embodied in Brooks’s Law: Adding people to a late software project only makes it later • Most thinking around scaling an
This talk was given by Joel Koshy (Senior Software Engineer at LinkedIn) at the Hadoop Summit (June 2013).Read less
HBase on Flash Presentation Transcript Fusion-io Confidential—Copyright © 2013 Fusion-io, Inc. All rights reserved.Fusion-io Confidential—Copyright © 2013 Fusion-io, Inc. All rights reserved.HBase on FlashMatt KennedyHBaseCon June 13, 2013 Switch your database to flashnow. Or you’re doing it wrong.Brian Bulkowski, Aerospike CTO and co-founderJune 10, 2013 2http://highscalability.com/blog/2012/12/1
1. Hive/Pigを使ったKDD'12 track2 の広告クリック率予測 油井 誠 m.yui@aist.go.jp 産業技術総合研究所 情報技術研究部門 Twitter ID: @myui スライド http://www.slideshare.net/myui/dsirnlp-myuilt 1 http://goo.gl/Ulf3A 2. KDDcup 2012 track2 • 検索ログを基に、検索エンジンの広告のクリック 率(Click-Through Rate)を推定するタスク – 中国の3大検索エンジンの一つsoso.comの実データ • 検索語などはHash値などを利用してすべて数値化されてい る – Trainingデータ(約10GB+2.2GB, 15億レコード) – Testデータ(約1.3GB, 2億レコード) • 学習データの1.33割が評価用データセット –
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く