タグ

ブックマーク / treasure-data.hateblo.jp (6)

  • 「データドリブン開発時代の技術とその選びかた」:デブサミレポート - トレジャーデータ(Treasure Data)ブログ

    はじめに 2015/10/14 にデータエンジニアのためのビッグイベント,Developers Summit Autumn が開催されました。今回のテーマは「データを巡るテクノロジーの冒険」 ,データ関連のテクノロジーにフォーカスしています。このイベントに弊社のソフトウェアエンジニアである田籠(@tagomoris)が登壇しました。今回は彼の発表内容について,多くの皆様に知ってもらうべく,解説していきます。 トレジャーデータ 田籠 聡 【データドリブン開発時代の技術とその選びかた】 Data-Driven Development Era and Its Technologies from SATOSHI TAGOMORI 要旨 ビッグデータやデータサイエンスといった用語が頻繁に用いられるようになって久しくなりました。データを中心とした開発も実際に各企業で行われるようになっておりそれはますま

    「データドリブン開発時代の技術とその選びかた」:デブサミレポート - トレジャーデータ(Treasure Data)ブログ
    kimutansk
    kimutansk 2015/10/23
    「What」をまずは明確にし、その後手段考えるのはフルマネージから完全自前まで幅広く手段がそろったからこそ実践できる感がありますね。
  • (新機能)「Data Connector for Amazon S3」によるデータロード革命 - トレジャーデータ(Treasure Data)ブログ

    はじめに トレジャーデータでは,あらゆるデータソースにリーチするデータ収集ツールを用意していますが,新しい収集機能として「Data Connector」を順次リリースする予定です。 ↑ 従来の収集ツールに関しては過去記事をご覧下さい。 何が新しいのか? さて,今回紹介する「Data Connector for Amazon S3」はその名の通り,Amazon S3上のデータをトレジャーデータに設定のみで「バルクデータロード」する機能です。この機能は先日オープンソースとしてリリースされた Embulk をベースにしたものです。 Embulk については以下の過去記事をご参照ください。 従来の Bulk Import 機能は「Client to Server」型 従来のトレジャーデータの「バルクインポート」機能は,クライアント上の巨大なデータに対して,トレジャーデータへ安全かつ効率良く実行する

    (新機能)「Data Connector for Amazon S3」によるデータロード革命 - トレジャーデータ(Treasure Data)ブログ
    kimutansk
    kimutansk 2015/06/24
    TD内でEmbulkのWorkerを起動してインポート可能になりましたか。外部からアクセス可能なものは将来的に一通りこれでカバーされる感じですかね。
  • トレジャーデータが生きるベストフィットケース7: 3. 単調な定型レポーティング業務はもうたくさんだと思っている 〜その1〜 - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 トレジャーデータが生きるベストフィットケースを7つ紹介します。前回までは1と2について紹介しましたが、今回は、3.について解説します。 何から始めればよいか迷っている 現場から「即答」を求められる 単調な定型レポーティング業務はもうたくさんだと思っている データが散在していて管理できていない パフォーマンス低下を恐れ、古いデータやテンポラリデータを消している わかりやすくて視覚にも訴えるレポートを要求されている 分析の用途以外に、異常を検知する仕組みを導入したい 3. 単調な定型レポーティング業務はもうたくさんだと思っている 毎月の定型レポーティング作りにうんざりしている分析者は今でもたくさんいると思います。 ここでは、すでにTreasure Data Serviceを利用していて、集計のためのデータソースは一元管

    トレジャーデータが生きるベストフィットケース7: 3. 単調な定型レポーティング業務はもうたくさんだと思っている 〜その1〜 - トレジャーデータ(Treasure Data)ブログ
    kimutansk
    kimutansk 2015/03/25
    まさかSpreadSheetがここで出るとは。ただ、実際クラウド上のデータやり取りで可能なのは非常に使いやすいですが。
  • Treasure Data Tech Talk #1 開催報告 - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 3月11日と12日の二日間で、Treasure Dataのエンジニアによるイベント Treasure Data Tech Talk 〜クラウドサービスを支える技術〜を開催いたしました。 Treasure Data Tech Talk 〜クラウドサービスを支える技術〜 http://eventdots.jp/event/373902 Treasure Data Tech Talk 〜クラウドサービスを支える技術〜 “The Deep Day” http://eventdots.jp/event/387738 二日間で200名以上の方に参加していただき、私たちも非常に貴重な時間を過ごすことができました。 参加者の皆様、会場を提供をしてくださったフリークアウトさんとDeNAさん、またイベント開催にご協力頂きましたdots

    Treasure Data Tech Talk #1 開催報告 - トレジャーデータ(Treasure Data)ブログ
    kimutansk
    kimutansk 2015/03/16
    Tech Talkの内容出ましたか。Plazmaも面白かったですが、Prestoの最適化やYARNの注意点についても非常に参考になります。
  • データ分析で大切な4つのこと:2. 誰のために・何のために分析をやるのかを意識する大切さ - トレジャーデータ(Treasure Data)ブログ

    データ分析で大切な4つのこと トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 2. 誰のために・何のために分析をやるのかを意識する大切さ そもそも誰の・何のために分析をするのかという意識を常に明確にしておくことはとても重要だと思っています。 人間の意志決定を支援するために解析をすること・解析結果自身が意志決定を行うのではないこと AmazonGoogle など多くのデータ先進企業では,例えば「リコメンデーション」「ページランク」「需要予測システム」など,分析結果自身が意志決定を行うようにデータが活用されています。この用途目的においては機械学習や統計モデルといった高度な手法が駆使され,データから機械的にベター(ベストとは限りません)な解をもたらし,それが自動的にサービスに適用されて回っていきます。これらは基的に大規模なデータセットを参照したりリアルタイムに

    データ分析で大切な4つのこと:2. 誰のために・何のために分析をやるのかを意識する大切さ - トレジャーデータ(Treasure Data)ブログ
    kimutansk
    kimutansk 2014/12/09
    人間の意志決定を支援するためにわかりやすく結果をまとめる/分析手法に対するこだわりを捨てる、と。最終的に判断者が人である以上そうなりますね。。。
  • データ分析で大切な4つのこと:1. 「当たり前の結果」をたくさん出す事の大切さ - トレジャーデータ(Treasure Data)ブログ

    データ分析で大切な4つのこと トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 ここ数年,データの大量な蓄積とそれに対する分散並列処理が可能な環境が成熟してきました。元々はデータの蓄積やバッチの効率化といった分析バックエンド(プラットフォーム)の方にフォーカスがあてられてきましたが,やっとその先のデータ」「分析」というところ,そしてその役割を果たすデータ分析者の重要性が理解されるようになってきているように感じています。 このブームは分析者にとって非常に喜ばしいことでもあると同時に,大きなプレッシャーにもなっているような気がします。 そのプレッシャーの1つに,企画者や経営者・あるいは顧客といった結果を活用する人々(=意志決定者)の,「これだけ材料(データ)が揃っているのだから多くの課題が解決できるはずだ」という期待に応えないといけないというプレッシャーがあると思いま

    データ分析で大切な4つのこと:1. 「当たり前の結果」をたくさん出す事の大切さ - トレジャーデータ(Treasure Data)ブログ
    kimutansk
    kimutansk 2014/12/02
    「新しい発見や経営クリティカルな結果は当たり前の発見の繰り返しの上に生まれてくる」と。なるほど。
  • 1