タグ

データ解析に関するh1saoのブックマーク (13)

  • Googleアナリティクスなどのツールにとらわれないウェブ解析の基本的な考え方 – marketechlabo

    ツールを問わずやりたいのはアクセス解析 Googleアナリティクスは無料でアクセス解析、ウェブ解析ができるツールで、手軽に使えるような環境からよく「Googleアナリティクスの使いかたを学びたい」という声が出てくる。 有料なので使う人はあまり多くはないが、アクセス解析ツールといえばAdobe Analyticsも同じ仲間であり、やることは同じである。 重要なのは「Googleアナリティクス」という固有のツールの使い方を知ることではなく、アクセス解析/ウェブ解析の目的とプロセスを学ぶことである。ツールの違いは方言みたいなもので、使うときに知識として学べばいい。そうしておけばGA、AAだけでなく、どんなツールにも対応できるし、ログ解析にも応用できる。 逆にそれを知らないと、情報量が多い、画面構成が複雑であるアクセス解析ツールに惑わされて 肝心のやりたいことをできない、出すべき情報を得るのに無駄

  • 探索的データ解析における正しい可視化手法の選び方と描き方 - Qiita

    データ分析における関数の使い方については様々な記事が上がっています。関数を知らなかったり使い方が分からないときは調べればだいたい答えが見つかります。 一方で、実際に分析を始めようとすると、たとえ関数の使い方がわかっていても、データをどのような切り口から何を分析・可視化していけば良いのか困ってしまうことがよくあります。 この記事では、あんちべさんが書いたデータ解析の実務プロセス入門というをベースに、どのようなデータから何を見たいときにどのような可視化手法を使えばよいのかを、具体例を交えながら整理していきます。 探索的データ解析とは データ解析のアプローチは、大きく分けて仮説をデータで検証する「仮説検証型」とデータから仮説を生み出す「探索型」に分けられます。 実際にデータ解析を行うときは、仮説検証型と探索型を行き来しつつ知見を見出していきます。 データ解析には検証すべき仮説を設定することが必

    探索的データ解析における正しい可視化手法の選び方と描き方 - Qiita
  • https://openbook4.me/projects/183

    https://openbook4.me/projects/183
  • 1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py

    前回の「ゲームプログラマからデータサイエンティストに転職しました」 の記事でもお話したとおり、5月からデータ解析する人になりました。 とはいえ、データ解析に関しては未経験。 少しでも不安を減らすために、4月の有給消化期間は統計学のお勉強しました。 今回はおすすめしてもらった中で読んで良かったの紹介、そして読んだの簡単なまとめを書いて行きたいと思います。 ※前提: 4月時点の自分の知識に関して 自分は大学は情報科学を専攻していたが、難しい数式は苦手 統計学は1コマ分受講していたが、単語を覚えている程度でかなりあやうい まず一番最初に読みたい 「完全独習 統計学入門」 「簡単に統計学の全体像がつかめる入門書はないか」とTwitter相談したら、こちらのを数名の方が薦めて下さった。 完全独習 統計学入門 作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2006/09/28メ

    1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py
  • Kaggle事始め - Qiita

    はじめに データ解析の情強な方なら、Kaggle はご存じだと思います。データ解析のSkillを競うCompetitionサイトで、与えられたテーマ(Dataset)に対して、世界中のデータ解析有識者が様々なデータ解析手法を駆使してより高い正答率(Score)を競い合う場所です。 が、Kaggleそのものは知っていても、どうやればKaggleに実際に参加できてランキングに加われるのかは知らない、と言う方は多いと思います。この記事では、とりあえずKaggleの何らかのCompetitionに参加して、解析結果をSubmitして、(その時点の)順位/Scoreを確認するまでの操作手順/流れをチラ裏したいと思います。 KaggleのWeb pageは色々な情報/Linkが詰まっているので、ぱっと見取っ付きにくいかもしれませんが、ポイントをつかめば参加してScoreを付けて貰う所まではとても簡単で

    Kaggle事始め - Qiita
  • 2016年版 人工知能・データ解析・機械学習・深層学習で読んでみてよかった本 - akimachoのはてなブログ

    はじめに 師走の忙しくなる前に、今年読んでみたをまとめてます。思いついたらコメントを追加していきます。 注意 : のリンクにはAmazonアフィリエイトを使っています。これははてなの機能で、の表紙が表示されて私が思い出すのに便利だからです。 啓蒙書 AIの衝撃 去年読んで機械学習を勉強してみようと思った(2015年出版)です。確か「深層学習だかのシステムを構築できる技術者は世界に20〜30人くらいしかいない」という文言があったのですが、この一年でだんだんとAI技術もコモディティ化してきたのかなーと感じています。 AIの衝撃 人工知能は人類の敵か (講談社現代新書) 作者: 小林雅一出版社/メーカー: 講談社発売日: 2015/03/19メディア: 新書この商品を含むブログ (15件) を見る 人工知能は人間を超えるか 人工知能の研究者によるやさしい解説書です。人工知能が社会に与える

    2016年版 人工知能・データ解析・機械学習・深層学習で読んでみてよかった本 - akimachoのはてなブログ
  • ゼロから学ぶテキストマイニング。参考書籍・Webサイトまとめ9選。概要、仮説の構築、R言語、RMeCab、twitteRなど | エコテキブログ

    先日、形態素解析に関するまとめ記事を書きましたが、いまいち煮え切れません。なぜなら、Tiwtterのつぶやきについて、形態素解析だけを行っても、それだけで何か面白い知見を得られるわけではないからです。 そこで、最近個人的に目をつけたのが、テキストマイニングという技術です。そこで、今回はゼロから学ぶテキストマイニングとして、参考になりそうなやWebサイトの「まとめ」をしてみました。 テキストマイニングの概要 Webサイトよりも、の方が参考になりました。読んだのは、テキストマイニングを使う技術/作る技術―基礎技術と適用事例から導く質と活用法です。 第1章しか読んでませんが、30分ほどでテキストマイニングを使って、何ができるか分かりました。個人的には、以下の3点について印象が残りましたので、引用させてもらいます。 1.分析技術としてのテキストマイニングの特徴(P16) [table id=

    ゼロから学ぶテキストマイニング。参考書籍・Webサイトまとめ9選。概要、仮説の構築、R言語、RMeCab、twitteRなど | エコテキブログ
  • クリスマス暇過ぎて腐女子人気作品の探索的データ解析を行うしかなかった - あんちべ!

    はじめに クリスマスはいつものように全く予定無かったあんちべです、こんばんは! 皆様はクリスマスをお楽しみになられましたでしょうか? 「今yesと答えた奴ら全員地獄に堕ちろ」ってサンタさんにお願いしておいたからな。 さて、世間のリア充様がクリスマスで浮かれまくりやがっていらっしゃる中、 やること無さ過ぎていつものようにpixiv腐女子向け作品を眺めていたところ、 ありがたいことに寂しさを感じる暇もない勢いでどんどん作品が投稿されていました。 ハッピーですね! …………? クリスマスの真っ只中に腐女子絵を投稿している…だと!? クリスマスと言えば皆さんお楽しみのはずでは? いや、クリスマスの夜にむしろ投稿数が増加しているような気が…? という疑惑を抱いたので、実際データを色々眺めてみましょう。 データの説明 データはpixivから下記タイトルで検索した結果を12/26の午前中時点で 各々1

    クリスマス暇過ぎて腐女子人気作品の探索的データ解析を行うしかなかった - あんちべ!
  • Pythonを使用したデータ解析入門01 - Λlisue's blog

    どうも、ブログのサブタイトル通り更新をサボっていた有末です。 僕は生物学を専攻している関係上Pythonは主に研究データの解析に使用しています。記事では懐石に関して今まで試行錯誤して得てきたノウハウを共有したいと思います。主に生データのグラフ化について書いていきます。タイトルに01とかつけてますが徒然なるままに更新されないブログなので次回作にはあまり期待しないでください。 前提 記事では以下の条件を前提としています。例の通りWindowsは対象外ですのでGoogle先生に聞くなどして各種必要ライブラリのインストールなどを行なってください。なお下記で使用しているpipはWindowsに対応していなかったと思うので代わりにeasy_installを使用することになると思います。 OS: Debian Wheezy 64bit Python: Python 2.7 必要ライブラリ pip -

    Pythonを使用したデータ解析入門01 - Λlisue's blog
  • rChartsでR言語のデータ解析結果をダイナミックに可視化しよう

    連載ではTIS株式会社が提供している技術ブログ「Tech-Sketch」から「コレは!」というテーマをピックアップし、加筆修正して皆様にお届けしております。今回は、最近注目が集まっている統計解析向けプログラミング言語であるR言語(以下R)、そのオープンソースパッケージであるrChartsを紹介します。データ解析を行いたい場合、Rは非常に強力なツールです。しかし、実際に出力したRのグラフの見た目については、何か物足りなさを感じます。その物足りなさを補うために、今回Rで簡単なデータ解析した結果を、rChartsでダイナミックに可視化してみたいと思います。 Rはオープンソースの統計解析向けのプログラミング言語であり、その開発実行環境でもあります。統計解析に特化した言語にはSAS、SPSSなど、有償のものが多い中、Rは無償で使うことができます。その結果として、Rは多くのユーザに支持されています。

  • rChartsを使ってR言語のデータ分析結果を可視化する - Tech-Sketch

    最近、ビッグデータ、データサイエンティストという言葉を耳にする機会が増えてきました。そして、統計解析向けプログラミング言語である R にも注目が集まっています。R を使って、データ解析したいというニーズも増えてきています。今回、そのR で簡単なデータ解析した結果を、オープンソースパッケージのrCharts を使って可視化してみたいと思います。 統計解析向けプログラミング言語 R とは <img alt="Rlogo.png" src="http://tech-sketch.jp/Rlogo.png" width=181" height="137" class="mt-image-right" style="float: right; margin: 0 0 20px 20px;" /> R はオープンソースの統計解析向けのプログラミング言語であり、その開発実行環境でもあります。R が、他の

  • RStudio & knitrによるRの解析結果のドキュメント化 - About connecting the dots.

    はじめに データ解析を行った場合,後からやり直しや結果参照,解析の詳細を確認するのって,案外だるいと思いませんか? 私は思います.結果を後から見直して,これってどうやってやってたんだっけとか,この部分変えたいとか,データ処理の細かい部分を確認したいとか,後日分析を引っ張りだして再確認することってよくあります.でもそのときに,詳細を忘れたり,ファイルが複数の箇所に分散しちゃってたり,なんてことがあって結局もう一度一からやり直すはめになったなんて悲しい経験はしたくないですよね. そんな折に,ちょっと前のTokyo.RでやってたそろそろRStudioの話をみて,これをもとに環境構築から,解析結果の管理までをトータルでやってみましょう,というお話です. 環境構築 生のRはぶっちゃけ使いにくいので,RStudioを使います.SPSSとかSASとかStataとかと比べても,割と遜色ない十分な出来の解析

    RStudio & knitrによるRの解析結果のドキュメント化 - About connecting the dots.
  • 「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ - 六本木で働くデータサイエンティストのブログ

    先日の記事はおかげさまで好評をいただいたんですが、勉強中の身で教科書を確認せずに書いたこともあり多数ツッコミをいただきました。ツッコミをいただけるというのはもちろん大変良い勉強の機会になるということで*1、今回もひとしきり勉強してみました。 ということで、自戒も込めて備忘録的に勉強したことをまとめておこうと思います。今回はあまり広く読んでもらう内容ではないので、不親切かもしれませんがごめんなさい。ただし、あまりにも理論的側面ばかり色々書いても何なので、インターネット広告業界の言葉で喩えて言うなら「クリック数*2をモデリングしたい場合」と「コンバージョン数*3をモデリングしたい場合」とに分けた、と理解してもらえたら良いかなと思ってます。 今回も参考文献は久保です。一般化線形モデルまわりではこのより分かりやすいは依然としてないと思います。 データ解析のための統計モデリング入門――一般化線

    「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ - 六本木で働くデータサイエンティストのブログ
  • 1