タグ

oReillyとデータマイニングに関するkana321のブックマーク (2)

  • 入門 ソーシャルデータ 第2版

    書を読めば、学べてよかったと思うことが身につき、あなたの道具箱に必要不可欠なツールが加わるが、おそらくそれよりも重要なのは、あるストーリーが語られ、その過程がとても楽しいことだ。そのストーリーとは、ソーシャルウェブサイトをめぐるデータの科学であり、ソーシャルサイトに詰め込まれたデータは何なのか、それらのデータを使ってあなたが(あるいはほかの誰かが)できることとして、どのような可能性があるのかといったことだ。」(書「はじめに」より) 書では、Twitter、Facebook、LinkedIn、Google+、GitHubなどのソーシャルウェブサイトを取り上げて、データマイニングを行うために必要な技術知識や手法を解説しています。書の前半では基礎概念を学び、後半ではソーシャルウェブサイトをマイニングするためのツールやテクニックを広く紹介しています。データサイエンティストやアナリスト、あ

    入門 ソーシャルデータ 第2版
    kana321
    kana321 2014/09/23
    入門 ソーシャルデータ 第2版――ソーシャルウェブのデータマイニング
  • バッドデータハンドブック

    TOPICS Data Science , Database 発行年月日 2013年09月 PRINT LENGTH 310 ISBN 978-4-87311-640-2 原書 Bad Data Handbook FORMAT PDF 値の欠落、形式から外れたレコード、エンコーディング形式が不明な文字列。「バッドデータ」と聞いた時に思い浮べる典型例です。しかし、これら以外にも「そもそもデータにアクセスできない」「消えてしまった」「昨日と違っている」「データはあるが形式が処理に適していない」など、データを収集・分析するエンジニアは、これらの「バッドデータ」と正面から向きあわなければならないことが多々あります。書では、これらの問題のあるデータのパターンを紹介し、その対処法を解説しています。 19人のデータ分析の専門家が、自らの経験を通して得た、さまざまな教訓、実践的な方法論等を詳述した書は

    バッドデータハンドブック
  • 1