タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Pythonとscrapingに関するandreryuのブックマーク (2)

  • Python BeautifulSoup でスクレイピングする

    Pythonhtmlスクレイピングするためのライブラリは lxml や PyQuery、Scrapy 、BeautifulSoup などいくつかありますが、私は BeautifulSoup を使っています。 バージョンが 3 系と 4 系がありますのでインストール時に注意が必要です。 beautifulsoup4 が 4 系で、 BeautifulSoup が 3 系となります。それさえ間違わないようにすればあとは pip でサクッとインストールするだけですので簡単ですね。 ドキュメントの日語訳を公開してくださっている方がありますのでこちらを読めばだいたい大丈夫そうです。 kondou.com - Beautiful Soup 4.2.0 Doc. 日語訳 (2013-11-19最終更新) 今回ちょっとしたスクリプトを書いていて使った部分を書いてみます。 たとえば以下の様な

  • BeautifulSoupを使ってスクレイピングをしてみる |

    そもそもスクレイピングとは? わかりやすく説明すると特定のWebサイトをプログラミングによって必要な情報を取得したりする行為のことです。 スクレイピングが行えるようになるとムフフなサイトからムフフな画像の取得をプログラムを実行するだけで行えるようになります。 スクレイピングを始める Pythonのことをあまり知らない人にPythonの基文法のまとめという記事を書いたので これを読むと他の言語を触ったことがある方は雰囲気がわかると思います。 今回はスクレイピングをするためにBeautifulSoupというライブラリを使ってみます。 BeautifulSoupを知らない方に説明するとBeautifulSoupはPythonで動作するHTMLとXMLのパーサーです。 これを使用することでjQueryみたいにHTML/XMLの要素の取得を簡単に行えるようになります。pipを使ってインストールを行

  • 1