タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

pythonとemrに関するblueleのブックマーク (2)

  • PyCon 2014でPython+EMRについて発表してきた

    今週末、PyCon JPに初参加し、初技術系発表してきた。 YouTubeでの発表もみたんですが、噛みまくっててヤバメな表情してるタイミングがあるんですが、あれは発表してる時間を計測しているiPhoneの電池が切れた時と、後ろに「あと5分」をお知らせする紙が上がった時です。スーパー焦った。 また、全般的にテンション高めだったのは単に元気になる飲み物をキメてたからです。 謝辞 PyConの運営をしてくださったみなさん、当にありがとうございました。あのような大規模なイベントをあれだけスムーズに運営されるスキル、当に凄いです。 tagomorisさんのData Analysis Flowの図をベースに前半は説明行いました。恐らくあの図がなかったら発表前日にあのような資料を作ることはできなかったと思います。ぼんやりしている概念を図に落としこんで公開して頂き、当にありがとうございます。(ちょっ

  • Python + Hive on AWS EMR で貧者のログサマリ

    1. Akira Chiku is an engineer who works on an engineering team. Their requirements include collecting between 10-20GB of data per day from various sources like Hadoop and Hive. 2. Data is collected from sources like Fluentd and parsed using Query String and stored in Hive. It is then processed and visualized. 3. Data can be stored in S3, processed using services like AWS EMR, and visualized in das

    Python + Hive on AWS EMR で貧者のログサマリ
  • 1