Pythonで機械学習を行おうと思った時にどうしても必要となる各種データ。それを集めるための手段の一つであるWebページからのスクレイピングを極簡単にやってみたいと思います。 1,目的 スクレイピングについての理解を深める 実際のwebページからデータを取得してCSVファイルに保存する 2,スクレイピングとは? Webページから特定のデータを抽出する技術 といっても、Webページをそのまま取得してデータベースやファイルに突っ込めば、そのままデータが得られるわけではありません。 ご存知の通り、Webページはお望みのデータだけでなく、各種タグやCSS、ものによってはJSなどが含まれており、そこから目的となるデータを取り出さなくてはなりません。 その為に必要なのが、Webページの構文解析になります。 これは読んで字のごとくなのですが、取得したWebページを解析し、任意の条件や要素を持つもののみ引