タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

PythonとpythonとTreasureDataに関するrokujyouhitomaのブックマーク (2)

  • ETLフレームワークとジョブ管理 - wyukawa's diary

    Treasure Dataが面白い記事を書いていたのでこれに関連してETLフレームワークとジョブ管理について僕の経験、意見を書いてみようと思います。 Managing the Data Pipeline with Git + Luigi - Treasure Data Blog リンク先の記事を僕なりに要約すると、 データやそれを加工するスクリプトがちらばって管理が辛くなり、エラーが起きた時のリカバリが難しい。 ↓ それを解決するETLツールというのもあって、例えばGUIでフローチャートみたいなのを書いてデータの加工処理を行うことができる。 ↓ それだとバージョン管理できないし、ビッグデータにフィットしないケースもある。 ↓ そこでGitとLuigiを使ったData Pipelineが良いよ! 紹介されているコードの例がこちら。 Hiveで集計してTDのテーブルにinsertするのがTas

    ETLフレームワークとジョブ管理 - wyukawa's diary
  • Python Pandasからトレジャーデータを叩く - Qiita

    Python and Treasure Data トレジャーデータでは、何よりも分析者、意思決定者のデータ分析を楽にすることをビジョンとしています。SQLで生データを触れる当社サービスですが、より込み入った分析をしたり、既存のスクリプトやツール群を活かそうと考えると、どうしてもRやPythonに手を伸ばしたくなります。 Rに関してはJDBCドライバーから接続することができ、実際お客様にもご利用いただいているのですが、そういえばPythonからどうやるんだったっけなと先日ふと思いまして、ちょっと調べてみたところ、衝撃的な事実が発覚しました。 トレジャーデータにはPython Clientがない!(UPDATE: うちのエースpythonistaが作りました) サードパーティーのがあるかなと探してみたりもしましたがありません。これでは、Python/Pandasを十八番としているデータサイエン

    Python Pandasからトレジャーデータを叩く - Qiita
    rokujyouhitoma
    rokujyouhitoma 2014/12/24
    PythonでHTTP API叩くお話
  • 1