タグ

hiveに関するmytechnoteのブックマーク (4)

  • Presto: Free, Open-Source SQL Query Engine for any Data

    Calling our Presto community speakers – we want to hear from you! Fill out out community call for papers to speak at upcoming meetups and conferences. What is Presto?Presto is an open source SQL query engine that’s fast, reliable, and efficient at scale. Use Presto to run interactive/ad hoc queries at sub-second performance for your high volume apps.

    Presto: Free, Open-Source SQL Query Engine for any Data
  • 「テクノロジー系スタートアップ3社の成長をドライブする技術」ログ | F's Garage

    メルカリ、SmartNews、フリークアウト3社合同のエンジニアイベントに潜入することに成功しまして、そのログをBASE社長の鶴岡に共有する約束をしたのですがQiita Teamがまだ試用版で社員全員に見せられないため、ここに張っておきます。 適当なメモですいません。なおLogmiの河原さんがいらっしゃったので、後日、ちゃんとした書き起こしが別途公開されると思いますので、頑張って見なくて良いと思います。 経営者層は後半の方が推奨部分です。 あくまでも僕のフィルターが入った記述なので、問題がありそうなところがあっても過激な反応はしないでください。 もしイベント関係者の方で誤りや問題がある記述がありましたらお教えください。修正いたします。 ————————– フリークアウト 箭内さん プロダクトマネージャー SIerで、PG/SE -> 広告専門で5年半 DSP ,DMPのプロダクトマネジメン

    「テクノロジー系スタートアップ3社の成長をドライブする技術」ログ | F's Garage
  • Aimingデータ解析チーム現場だより - Qiita

    ホゲェ〜 なんか色々とまとめといた方が良さそうだ。 自分にとって数が多くて意味がわからんし。 まだ社内データは収集する環境を整えている状態だ。 整えているといってもできてるんだけど、 なんか色々と新しいツールが出てくるしそれに追っついて 書き換えちゃったりを繰り返している。 意味がわからなくなってきたのでまとめてみよう。 社内で共有するにはQiitaに上げたほうが良さそう。 あげちゃまずいものは書いてないつもりだ。 まずかったら消す。 データ解析チームが何やってるのかをまとめてみた。 各担当者の名前を出して問題なさそうなら出そうかなあ Aimingデータ解析チームについて データ解析チームだとつまらんし愛情がわかないのでチーム名をつけている。 Monolithだ。モノリス。あのモノリス。 @shibacowさんが考えだした。トテモ良いチーム名だと思う。 チームメンバー は以下の3名 @sh

    Aimingデータ解析チーム現場だより - Qiita
  • SQLite + Pythonユーザ定義関数組込で進捗ダメじゃないですになりました - あんちべ!

    概要 これまで「Hiveからデータ取得・簡単な加工→Pythonで加工・分析」 という流れで作業していたのですが、 Hive→SQLitePythonという流れにしたところ進捗が改善されたので、 SQLiteの簡単な使い方とPythonによるSQLユーザ定義関数の組込方法 についてメモを残しておきます。 特にユーザ定義関数の組込を自由に出来ると、 分析する際、相当楽になるということに気付きました。 SQLite挟むことで何がどう改善されたの? Hiveはデカいデータをゴリゴリ取ってくる分には SQLちょっと書くだけで済むので大変便利ですが、 初動遅いためちょこちょこ小さいデータを何度も取ろうとするとストレス溜まります。 そのため、これまではある程度のデータをまとめてHiveで落としてきて Pythonで加工してから分析するという流れを取っていました。 ただ加工するために似たようなコード何

    SQLite + Pythonユーザ定義関数組込で進捗ダメじゃないですになりました - あんちべ!
  • 1