この記事について Pythonとlxmlを使って、webスクレイピングでYahoo!ファイナンスから投資信託の基準価格を取得する方法を解説します。 [追記] Yahoo!ファイナンスからのデータスクレイピングは規約上禁止されているようなので、代わりの方法を利用ください。 Pythonでスクレイピング - 投信協会webから投資信託の基準価格を取得する 環境 Windows10 x64 Python 2.7.11 lxml 3.5.0 変更履歴 2016/1/16 lxml.html.parse()にurlを直接渡すようにした。urllib2のimportを無くした。 url生成の際に引数をdictに取ってからformat()で展開するようにした。 forの回し方を変更 ElementTreeからXPathで取得した要素に.encode('utf-8')する処理をあらかじめmap()でやって
![Pythonでスクレイピング - Yahoo!ファイナンスから投資信託の基準価格を取得する - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/b39ddf9f68240419001504e7b6eacafef1d44952/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9UHl0aG9uJUUzJTgxJUE3JUUzJTgyJUI5JUUzJTgyJUFGJUUzJTgzJUFDJUUzJTgyJUE0JUUzJTgzJTk0JUUzJTgzJUIzJUUzJTgyJUIwJTIwLSUyMFlhaG9vJTIxJUUzJTgzJTk1JUUzJTgyJUExJUUzJTgyJUE0JUUzJTgzJThBJUUzJTgzJUIzJUUzJTgyJUI5JUUzJTgxJThCJUUzJTgyJTg5JUU2JThBJTk1JUU4JUIzJTg3JUU0JUJGJUExJUU4JUE4JTk3JUUzJTgxJUFFJUU1JTlGJUJBJUU2JUJBJTk2JUU0JUJFJUExJUU2JUEwJUJDJUUzJTgyJTkyJUU1JThGJTk2JUU1JUJFJTk3JUUzJTgxJTk5JUUzJTgyJThCJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmcz1iOWI4OTM1YTAxOGZkMzJhNzA2MDI1ZDBhYTRmZDg1Zg%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBzYXdhZHlycjUmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPThlMGUxYTljZjU5OGE5ZTM5NmViMjE1NzkzYzgxYzQx%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3Dc2a311858538b577c0f764228cb43cd7)