トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 Tableau は様々なデータ表現を持っています。その個々を見る事によってData Visualization パターンを学びましょう。 上記スライドのp.28からの内容になります。 Tableau,トレジャーデータに関するお問い合わせは support@treasure-data.com まで。
Tableauが魅せる Data Visualization の世界 トレジャーデータはクラウドでデータマネージメントサービスを提供しています。
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 ゲーム業界の一大イベントである CEDEC2014 にてトレジャーデータも登壇してきました。本イベントに合わせて詳細な分析事例の紹介をテーマにしたプレミアムな内容になっております。 トレジャーデータのオンラインゲームソリューション トレジャーデータはオンラインゲーム分析をソリューションの形として,ログテンプレートに従った収集を行えばトレジャープラットフォームでデータ蓄積,集計,可視化を一気通貫した形で提供しております。オンラインゲームソリューションにつきましては以下のスライドをご参照下さい。 「5大キーワードで振り返るゲーム分析軸」 CEDECでのアジェンダは上記のキーワード毎に具体的な分析事例を紹介するという流れでした。 本イベントの資料はこちらの資料問い合わせフォームより入手することが可能です。
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 本シリーズではトレジャーデータのクエリエンジンについて紹介します。無尽蔵のトレジャークラウドストレージに対する集計方法は,HiveベースのバッチクエリとPrestoベースのアドホッククエリがあります。 これら2つはお互いを補完しあうような存在であり,ケースによって使い分ける事が肝要です。 トレジャーデータのバッチクエリとアドホッククエリを理解する1,2,3 上図はトレジャーで可能なアーキテクチャの一覧です。今回はアドホッククエリに着目してわかりやすく説明していきます。 3.アドホッククエリ型のアーキテクチャ 3. アドホッククエリ × データマート 前回はバッチクエリを,外部のデータマートに定期的に書き出す前段の処理の役割として紹介しました。もちろん結果書き込みをトレジャーデータ内のテーブルを指定する事で,データマ
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 本シリーズではトレジャーデータのクエリエンジンについて紹介します。無尽蔵のトレジャークラウドストレージに対する集計方法は,HiveベースのバッチクエリとPrestoベースのアドホッククエリがあります。 これら2つはお互いを補完しあうような存在であり,ケースによって使い分ける事が肝要です。 トレジャーデータのバッチクエリとアドホッククエリを理解する1,2,3 上図はトレジャーで可能なアーキテクチャの一覧です。今回はバッチクエリに着目してわかりやすく説明していきます。 2.バッチクエリ型のアーキテクチャ 2-1. バッチクエリ × Metric Insights バッチ型はデイリーなどの特定の時間インターバルで処理を実行するもので,その場で結果が返ってくることを期待しておりません。 Metric Insights と呼
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 本シリーズではトレジャーデータのクエリエンジンについて紹介します。無尽蔵のトレジャークラウドストレージに対する集計方法は,HiveベースのバッチクエリとPrestoベースのアドホッククエリがあります。 これら2つはお互いを補完しあうような存在であり,ケースによって使い分ける事が肝要です。 トレジャーデータのバッチクエリとアドホッククエリを理解する1,2,3 1. バッチクエリ v.s. アドホッククエリ 今回はバッチ型・アドホック型クエリの特徴を紹介します。 バッチ型もアドホック型も共にSQLライクのクエリによってデータ処理が可能になっています。大きな違いは,バッチクエリはデータソースに対して大規模な並列分散処理を行うのに対し,アドホッククエリは小規模の結果が得られる処理に対して高速にレスポンスを返すところです。
*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 本ブログはデータアナリティクスを中心に多様な記事を展開しております。(コンテンツマップは新規記事が更新される度に追記されていきます。) The blog is authored by Takahiro Inoue Chief Data Scientist at Treasure Data Twitter: @doryokujin Facebook: Takahiro Inoue Slideshare: doryokujin トレジャーデータ紹介 トレジャーデータ株式会社について アップデート情報 Treasure Data Service はどのようなケースに向いているか? トレジャーデータ流データ分析プロセス トレジャーデータ流 データ分析の始め方〜データサイエンティストがもたらす新
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 今週のアップデートによって,トレジャーデータの管理コンソールからのファイルアップロードがよりわかりやすくなりましたのでご紹介します。 ファイルアップロード 管理コンソールにログイン後,左メニューにある「Collect Data」→「File Upload」を選択します。 ファイル選択画面からはローカルのCSVファイルなどをドラッグまたはブラウズによって簡単にアップロードが行えます。また,過去にインポートしたファイル履歴も表示されるようになりました。 ファイル選択後は,それをどのデータベース・テーブルに格納するかを選択します。 ファイルがアップロードされると,カラム名とレコードのサンプルが表示されるようになります。この時点でカラム名の変更や型の選択が可能になりました。 バルクインポート・ストリーミングガイド また,「
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 Hadoop Conference Japan 2014 以前に告知したHadoop Conference Japan 2014で,弊社Software Architectの古橋が発表しました。 テーマは,Facebookが公開した新しい分散処理基盤,Presto。実はFacebookが彼らの超大規模なデータセットに対してインタラクティブに結果を返せるようにと開発されたものです。開発が始まってまだ2年も経っておりませんが,今ではトレジャーデータを初めとして多くのハッカー達がコミッターとして参加する活発的なプロジェクトに成長しています。 PrestoはHiveやImpalaと同じ「SQL Query Engine」であり,特に数百GBを超える大規模データに対してもインタラクティブなレスポンスを(コンマ0秒以下,遅くて
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 本ブログでは,可視化についてその手法やツールの紹介に関する記事をたくさん出しておりますが,今回は従来と異なった可視化手法を紹介することで多くの分析者に新たな考え方を提供できればと思っています。 従来の可視化方法について すごく当たり前の話ですが,可視化ツールというのは分析・集計された結果テーブルをインプットとして読み込むことで手続きが進んでいきます。可視化のためのチャートは非常に多く,ケースバイケースでその結果テーブルを最適に表現してくれるものを選ぶことになります。 しかしこの可視化というのはその表現方法があまりにも多いために,適切なチャートを選ぶのに苦労したり,意図したチャートで表そうとしても結果テーブルがそれにフィットしない項目で出されていたりと,それなりに苦労がありました。 そういった可視化の困難さに立ち向か
*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 本記事は 2014年06月27日に開催されたデータサイエンティストサミット2014での講演内容になります。 トレジャーデータ流,データ分析の始め方 from Takahiro Inoue トレジャーデータの提案する分析の始め方,分析プロセスは一般的なデータ分析プロセスとは異なったアプローチをとります。現在データ分析に携わっており,様々な事情でなかなか分析を始められない方々へ,この内容が周囲への声かけや説得材料になってもらえることになれば幸いです。 私は元々大学で数学科統計専攻していて,学生時代からデータ分析とはどうあるべきかを追究してきました。 またソーシャルゲーム会社でデータ分析基盤を作ったり集計のためのデータベースとしてMongo DBに可能性を感じ,コミュニティ運営などの活動もお
*トレジャーデータはデータ収集、保管、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 データサイエンティストサミット2014 トレジャーデータは 2014/06/27 開催のデータサイエンティストサミットで私,チーフデータサイエンティストの井上が登壇することになりました。プログラム でお時間を確認の上,ぜひとも私のセッションにお越し下さい。 本ブログを読んでいる方に,少しだけ発表内容をお知らせします。 今回は分野も業種も多種多様な方々が来ることを想定して,純粋なデータサイエンスの話ではなく,データもツールも何もないところからどのように分析を始めて行けば良いのか,トレジャーデータ流のデータ分析の始め方をご提案します。 分析に関わる全ての方に分析に関する悩みに共感を得て頂き,本発表内容を持って一人でも多くの方が分析を(あわよくばトレジャーデータを使って)楽に始められるなって
*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 事例で学ぶトレジャーデータ 20140612 from Takahiro Inoue 本シリーズは,紹介する3つの分野における事例を通してトレジャーデータサービスを深く理解してもらえる事を目的としています。 (事例1)「オンラインゲームソリューション (a) (b)」 (事例2)「モダンWebアナリティクス」 (事例3)「ECログ分析」 大量のデータを分析できるようになったことの大きな恩恵として「パス」や「セグメント」を柔軟に設定できる事が挙げられます。従来パスやセグメントは,その組み合わせが無数にあるために,データ量が多くないと各々のサンプル数が0になってしまい有意な比較が行えませんでした。大量データを現実時間で実行できるトレジャーデータサービスは,これらの分析を可能にしました。 今
*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 事例で学ぶトレジャーデータ 20140612 from Takahiro Inoue 本シリーズは,紹介する3つの分野における事例を通してトレジャーデータサービスを深く理解してもらえる事を目的としています。 (事例1)「オンラインゲームソリューション (a) (b)」 (事例2)「モダンWebアナリティクス」 (事例3)「ECログ分析」 これからWeb / EC ログの分析事例を紹介するのですがその前に,特定の分野によらない,トレジャーデータならではの分析メリットをお話しします。 大量のデータを分析できるようになったことの大きな恩恵として「パス」や「セグメント」を柔軟に設定できる事が挙げられます。従来パスやセグメントは,その組み合わせが無数にあるために,データ量が多くないと各々のサンプ
*トレジャーデータはデータ収集、保管、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 本シリーズは,弊社事例セミナーで発表した資料をベースに3つの分野における事例を通してトレジャーデータサービスを深く理解してもらえる事を目的としています。 オンラインゲームソリューション@トレジャーデータ from Takahiro Inoue 本シリーズは,紹介する3つの分野における事例を通してトレジャーデータサービスを深く理解してもらえる事を目的としています。 (事例1)「オンラインゲームソリューション (a) (b)」 (事例2)「モダンWebアナリティクス」 (事例3)「ECログ分析」 オンラインゲームソリューション 前回ではログの収集からダッシュボード(Metric Insights)に至るまでの分析の流れをご紹介しました。今回はオンラインゲームで活用されているベーシックなKP
*トレジャーデータはデータ収集、保管、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 本シリーズは,弊社事例セミナーで発表した資料をベースに3つの分野における事例を通してトレジャーデータサービスを深く理解してもらえる事を目的としています。 事例で学ぶトレジャーデータ 20140612 from Takahiro Inoue 本シリーズは,紹介する3つの分野における事例を通してトレジャーデータサービスを深く理解してもらえる事を目的としています。 (事例1)「オンラインゲームソリューション (a) (b)」 (事例2)「モダンWebアナリティクス」 (事例3)「ECログ分析」 オンラインゲームソリューション トレジャーデータ | 米国トレジャーデータ社/トレジャーデータ株式会社 オンラインゲーム向けデータマネージメントサービスをソリューションとして提供開始 今回は「オンライ
*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 データサイエンティストのためのHiveQL分析クエリテンプレートシリーズ: その1, その2, その3, その4, その5, その6 E. リテンション分析 最後はリテンションに関するクエリテンプレートです。 パターン E-1:直帰率 ※ ここでは同日内に1回しかログインしなかったユーザーを「直帰」と見なします。 SELECT t2.d AS d, COUNT(1)/SUM(t2.cnt)*100 AS bounce_rate FROM ( SELECT TD_TIME_FORMAT(time, 'yyyy-MM-dd', 'JST') AS d, uid, COUNT(1) AS cnt FROM login GROUP BY TD_TIME_FORMAT(time, 'yyyy-M
*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 トレジャーデータ株式会社について(for all Data_Enthusiast!!) from Takahiro Inoue トレジャー紹介資料:その1,その2,その3 Data Visualization Data Visualization は分析レイヤーの最後を担う重要な項目です。 データ可視化にも,データのフェーズによって表現方法は変わってきます。一般的には「Aggregated Data」を可視化する部分ですが,生データを可視化して全体傾向を見極めたり,集計済データをさらにクロス集計してテーブルの可視化を行ったり,より深い統計分析をしてそれに特化した可視化をする部分もあります。 Treasure Data では多々ある可視化ツールの中で,トレジャーデータサービスと親和性の高
はじめに ほとんど全ての会員制サービスには,顧客の「入会」と「退会」という概念があります。そして退会(ここでは離脱と呼びます)における分析は,それを防止するという目的において非常に重要です。本記事ではいくつかの「離脱分析」の手法を,トレジャーデータ+スプレッドシートだけで完結でき,かつ誰もが実践できる形でご紹介します。 「離脱分析」必要な最低限のデータセット 初めの2回で紹介する手法においては,分析に必要なデータセットはシンプルで汎用的なものです。最低限必要な項目は,「ユーザーID」「入会日時」「退会日時」この3つです。また,分析実行時にサービスを継続しているユーザーは退会日時の値は入っていないことになります。 今回は後々の分析にも備えて上記の項目以外に,もう少し多くの情報を持たせたデータ(これを raw_data と呼ぶことにします)を扱っていきます。本データでは「退会日」ではなく「最終
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く