はじめに Selenium (+ Chrome) でのファイル保存関係の方法をまとめます。 基本的操作: Python + Selenium で Chrome の自動操作を一通り 以下の説明の一部はChrome依存です(PDFのダウンロード、ヘッドレスモードでのダウンロードなど)。 注意事項 アクセス対象サイトの利用規約をよく読みます。 たとえばログインが絡むサイトなどは、機械的なダウンロードが禁止されていることもしばしばあります。(例:twitter) 自分だけでなく、自分の所属するグループごと大きなペナルティを食らうこともあります。(例:電子ジャーナル) 著作権をよく理解・考慮する必要があります。 サーバーの負荷もよく考えます。時間を十分空けながら処理をします。 並列にダウンロードをするのは避けたほうがよいでしょう。 URLリストだけ取得しておき、あとで順にダウンロードしていくのもあり