ブログ requestsで取得できないWebページをスクレイピングする方法 [PR] 2019/12/20 2020/10/7 | Python Webスクレイピング スクレイピングの定番の方法と言えば「requests + BeautifulSoup」の組み合わせです。一般的はWebページであれば、大抵はスクレイピングできます。 しかし、この方法で読み取れないWebページに遭遇することがあります。特にYahoo!やTwitterなど頻繁に更新されるサイトによくあります。 その原因は、「ダウンロードしたHTMLファイル」と「ブラウザに表示されるHTML」が異なるからです。そのため、requestsでサーバーから直接ダウンロードしたHTMLファイルをBeautifulSoupで解読してもブラウザで見ている内容と違うのでスクレイピングできません。 Yahoo! JAPANが運営しているYaho
![requestsで取得できないWebページをスクレイピングする方法 - ガンマソフト](https://cdn-ak-scissors.b.st-hatena.com/image/square/fc4d3f0ada3d8b33e0affc11c2c84fed88e18dc5/height=288;version=1;width=512/https%3A%2F%2Fgammasoft.jp%2Fpu7nk3cmg8%2Fwp-content%2Fuploads%2F2019%2F12%2Fweb_layout.png)