タグ

ブックマーク / doryokujin.hatenablog.jp (7)

  • Treasure Data Platform で始めるデータ分析入門 〜2. Data Collection〜 - doryokujin's blog

    Treasure Data Intro for Data Enthusiast!! from Takahiro Inoue シリーズではデータ分析を以下の7つのレイヤーに分解し,各々について解説していくものとします。(Slide Shareの資料は常時更新されます。) Data Collection Data Storage Data Management Data Processing Data Processing Design Part.1 Part.2 Part.3 Part.4 Part.5 Part.6 Data Visualization Treasure Viewer, MetricInsights, Tableau Data Visualization Patterns Part.1 Part.2 Part.3 日は「1. Data Collection」にフォーカス

    Treasure Data Platform で始めるデータ分析入門 〜2. Data Collection〜 - doryokujin's blog
    advblog
    advblog 2014/01/15
  • Treasure Data Platform で始めるデータ分析入門 〜1. イントロダクション〜 - doryokujin's blog

    はじめに これから全7回に渡ってTreasure Data Platformを使ったデータ分析の紹介をします。教科書はこちらになります。 Treasure Data Intro for Data Enthusiast!! from Takahiro Inoue シリーズの目的は2つ。 Treasure Data Platform Service の概要を理解してもらう。 シリーズを理解すればデータ分析が誰でも容易にレポーティングが可能になる。 今やデータサイエンティスト() という言葉は,高度な分析手法を駆使してあらゆる問題を解決するプロフェッショナル集団という響きがありますが,それは質ではありません。データサイエンティストの質は, 意思決定者(経営者,ディレクター,マネージャー)が容易に理解できるようなシンプルかつ説得力のある分析結果を提供することができること, データ収集からレ

    Treasure Data Platform で始めるデータ分析入門 〜1. イントロダクション〜 - doryokujin's blog
    advblog
    advblog 2014/01/10
  • Treasure Data Analytics 第2回 〜Treasure Data Cloud Warehouse について(後編)〜 - doryokujin's blog

    はじめに Treasure Data Cloud Warehouse(前編)では,サービスの概観を紹介しました。第2回では,実践的なデータ・アナリティクスを行う上で解決しなければならない問題をTreasure Dataではどのように解決しているのか,具体的に述べていきたいと思います: データ収集の問題:様々な種類のログをどのようにデータを集約・収集して,横断的な解析を可能にするか? ストレージの問題:増え続けていく大量のログを,どこに,どのようなフォーマットで,解析可能な状態のまま保管していくか? 解析結果の活用に関する問題:ログを解析した結果を,どのように可視化するか。あるいはどのように既存のシステムに統合・フィードバックしていくのか? 1. データ収集の問題 図1: fluentd はログ解析の前段,ログ収集における問題を解決してくれる 「解析対象のログを収集してくる」という作業は

    Treasure Data Analytics 第2回 〜Treasure Data Cloud Warehouse について(後編)〜 - doryokujin's blog
    advblog
    advblog 2013/02/18
  • Treasure Data Analytics 第1回 〜Treasure Data Cloud Warehouse について(前編)〜 - doryokujin's blog

    はじめに Treasure Data Analytics シリーズは,Treasure Data の提供するクラウドサービス上で実行可能な様々なデータアナリティクスのユースケースなどを紹介して行く長いシリーズです。第1回および第2回では「Treasure Data」とは何か,またその特徴およびメリットは何かについて紹介する予定です。 第1回では Treasure Data の提供する Cloud Data Warehouse サービスのイントロダクションを,第2回では「データアナリティクスを行うための Platform とは」という観点で Treasure Data の魅力をお伝えできればと思っています。 ※ なお Treasure Data は高度なインフラ・ソフトウェアテクノロジーを駆使しておりますが,シリーズはデータアナリティクスを主眼においており,このサービスを支えるインフラ基盤

    Treasure Data Analytics 第1回 〜Treasure Data Cloud Warehouse について(前編)〜 - doryokujin's blog
    advblog
    advblog 2013/02/10
  • Treasure Data Analytics 第4回 〜ブックレビューデータセットによるデータ解析入門(実践編1)〜 - doryokujin's blog

    はじめに 準備編ではデータセット:Book-Crossing Dataset を用意し, Treasure Data のツールベルト一式を導入した上でインポートし,簡単なクエリを実行するところまで行いました。シリーズでは Treasure Data のデモアカウントが必要になりますのでまだの方は準備編の方を先に参照下さい。 今回は「データを俯瞰する」をテーマに,解析対象としているデータセットがどのような姿をしているのかを視野広く眺めることにしましょう。このフェーズでは全く難しいことは行いません。ここでのキーポイントは セグメント:ノードやアクションのステータスから様々なセグメントを作成しその分布を眺める というステップを地道に行う事にあります。それによってどの「切り口」でデータを深掘りしていけば良いかが見えてくるのです。 データを俯瞰する データ解析は解析対象とするデータセットの概要を知

    Treasure Data Analytics 第4回 〜ブックレビューデータセットによるデータ解析入門(実践編1)〜 - doryokujin's blog
    advblog
    advblog 2012/06/29
  • コンプガチャの数理 -コンプに必要な期待回数の計算方法について- - doryokujin's blog

    目次 1. 『コンプガチャの数理 -コンプに必要な期待回数の計算方法について-』 2. 『「数学ゲームデザイン」というアプローチ』 3. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その1-』 4. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その2-』 目的 コンプガチャのコンプに必要な回数を求める問題は「The Coupon Collector's Problem」と呼ばれる数学モデルの枠組みに沿った美しい問題である事を述べ,いくつかの有用な結果を示す。 ※ あくまで個人研究のつもりで書いたので,色々不備があるかもしれません。その際は一言頂けると助かります。 定義 コンプガチャ問題を Coupon Collector's Problem に準じた形で書くと以下の様になる: 「全部で n 種類のアイテムがあって,1つのガチャの中にアイテムが1つ入って

    コンプガチャの数理 -コンプに必要な期待回数の計算方法について- - doryokujin's blog
    advblog
    advblog 2012/05/09
  • 〜うまく動かすMongoDB〜仕組みや挙動を理解する - doryokujin's blog

    @doryokujinです。この業界で非常に強い影響力を持つ@kuwa_tw氏が某勉強会でMongoDBについてdisられており、このままではMongoDB自身の存続が危ういと思い、急遽ブログ書きました。(冗談ですよ) ザ・ドキュメント〜うまくいかないNoSQL〜 View more presentations from Akihiro Kuwano MongoDBを使っているときに出会うトラブルをうまくまとめてくださった「MongoDBあるある」的な良い資料だと思います。今日はここで書かれているトラブルの解決方法を提示したいと思います。恐らく@kuwa_tw氏は全ての解決方法を知っていながら、同じトラブルへ悩む人のためにあえてdisったのだと思います。 MongoDB はデータベースもコレクションも存在しなければ自動作成してくれる mongoシェルを起動する場合、たいていは $ mong

    〜うまく動かすMongoDB〜仕組みや挙動を理解する - doryokujin's blog
    advblog
    advblog 2011/05/19
  • 1