タグ

2013年9月6日のブックマーク (1件)

  • PythonでBeautiful Soupを試してみる。

    PythonHTMLの解析を行うのによさそうだったので、 試してみることにした。 まず必要なのが、 BeautifulSoup まずインストール(ってかファイルをPythonが読める場所にBeautifulSoup.pyを置くだけ。) ここからダウンロードする。 それを今回は「site-packages」の下に置いてみた。 清水川Webを参考にさせてもらったためです。 やってみます。 >>> import urllib2 >>> opener = urllib2.build_opener() >>> html = opener.open(‘https://kishi-r.com/2008/02/ubuntu_1.html’).read() >>> print html HTML内の情報が表示されました。 ここでBeautifulSoupを使って「title」のみを解析してみます。 >>>

    willnet
    willnet 2013/09/06
    HTMLパーサーなのかな