ここではPythonで行うHTML解析 (パース)を解説します。取得したHTMLから様々な処理を行うことができます。 HTML文字列の取得 5行目で指定URLをオープンし、6行目で取得したHTML文を表示しています。 Python 3系 import urllib.request url = 'http://www.python-izm.com/' htmldata = urllib.request.urlopen(url) print(htmldata.read().decode('UTF-8')) htmldata.close() Python 2系ではurllib2モジュールなので注意してください。 Python 2系 # -*- coding: utf-8 -*- import urllib2 url = 'http://www.python-izm.com/' htmldata
![HTML解析](https://cdn-ak-scissors.b.st-hatena.com/image/square/3a838252a70d308b429f2bda21788e6f0f6a51f9/height=288;version=1;width=512/https%3A%2F%2Fwww.python-izm.com%2Fwp-content%2Fuploads%2F2017%2F01%2Fsite_icon.png)