エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
第2回 rvestによるWebスクレイピング|Tech Book Zone Manatee
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
第2回 rvestによるWebスクレイピング|Tech Book Zone Manatee
データ分析の現場においては、使用するデータをWebから取得してこなければならないことが多々あります。... データ分析の現場においては、使用するデータをWebから取得してこなければならないことが多々あります。本記事ではマイナビBOOKSに対してRを用いたWebスクレイピング(Scraping)を行い、"コンピュータ書籍 人気ランキング100位まで"の情報を取得してみます。 1. はじめに データ分析を行うためには当然その元となるデータが必要です。 そのデータが、データベースに既に保存してある場合は、 Rから接続可能なデータベースドライバを経由して、そのままSQLなどを実行すれば問題ありませんが、欲しいデータがWebページ上にあり、かつ、そのサイトがAPIを提供してない場合には、 何らかの手段を用いてデータを取得しなければなりません。 もちろん、必要なデータの数があまり多くない場合には、Webページからコピー&ペーストすることでデータを抽出することもできますが、 データ分析の現場で使用するデータは