タグ

ブックマーク / osanai.org (1)

  • Python BeautifulSoup でスクレイピングする

    Pythonhtmlスクレイピングするためのライブラリは lxml や PyQuery、Scrapy 、BeautifulSoup などいくつかありますが、私は BeautifulSoup を使っています。 バージョンが 3 系と 4 系がありますのでインストール時に注意が必要です。 beautifulsoup4 が 4 系で、 BeautifulSoup が 3 系となります。それさえ間違わないようにすればあとは pip でサクッとインストールするだけですので簡単ですね。 ドキュメントの日語訳を公開してくださっている方がありますのでこちらを読めばだいたい大丈夫そうです。 kondou.com - Beautiful Soup 4.2.0 Doc. 日語訳 (2013-11-19最終更新) 今回ちょっとしたスクリプトを書いていて使った部分を書いてみます。 たとえば以下の様な

  • 1