タグ

2017年6月14日のブックマーク (2件)

  • 『Rによる自動データ収集』を読んだ - 僕らはRを愛しすぎてる

    訳者の方からご恵贈いただきました。 文だけで500ページを超える重厚な書籍で、HTMLやXMLの基礎、正規表現やXpathの仕組み、データ分析プロジェクトの管理までちゃんと押さえつつ、ネットワーク分析、ツイートマイニング、地理的データの可視化、ECサイトからのマイニング・センチメント分析などなど事例も豊富。 それら事例のそれぞれに紙幅をふんだんに割いて記述されてあり、 入門者がいざ実際の課題に取り組む際に重宝しそうな、単にデータ収集するコードだけでなく分析の進め方や考え方がきっと役に立つ、と思わされる一冊でした。 確かに値段は高めだけど、分量を考えたらむしろお得なので、Rを使うならデータ分析の部署にひとつ買って置いといて損はないはず。 出版社のページはこちら。 Rによる自動データ収集 ―Webスクレイピングとテキストマイニングの実践ガイド― / Simon Munzert 他著 石田

    『Rによる自動データ収集』を読んだ - 僕らはRを愛しすぎてる
    turu_crane
    turu_crane 2017/06/14
  • 『Real World HTTP』という書籍を(9年ぶりに)編集しました

    発売されています。EbookはPDF、EPUB完備です。 Real World HTTP - 歴史とコードに学ぶインターネットとウェブ技術 どんななのか? 内容は、書誌情報のページに書いてある通りですが、いまのHTTPの仕様とその周辺にある技術を、その成立過程を紐解きつつ紹介するという書籍です。 HTTPってメソッド送ってレスポンスが返ってきて、ヘッダーとボディがあって、ステータスコードが...というのは何となく知っているという人もそれなりにいらっしゃると思います(僕もその位の知識でした)。 ですが、ふと「ダウンロードの中断と再開ってどうなってるんだっけ」とか「SSLが安全ってどういうこと」とか「ブラウザでビデオ見られるやつってどうなってんの」とか考え出すと色々わからない。 そういった疑問について、おおよその概要を紹介しつつ、元の仕様や情報へのポインタがまとめられております。こんなが読

    『Real World HTTP』という書籍を(9年ぶりに)編集しました