Python のモジュール、Scrapyを用いれば、ウェブサイトのデータを、リンクを巡回しながら順次自動的に取得できます。 ウェブサイトから所望のデータを抽出するには、欲しいデータの場所 を指定してあげなければなりません。 指定するものをセレクタと呼びます。Scrapyではcssと、xpathの指定方法がありますが、今回はxpathのして方法について説明します。 準備 Scrapyをpipでインストールします。
![Python Scrapy でウェブサイトからデータを抽出する際の、xpathまとめ - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/db62f423fd57bf6553241de61bf33803c68cfeac/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9UHl0aG9uJTIwU2NyYXB5JTIwJUUzJTgxJUE3JUUzJTgyJUE2JUUzJTgyJUE3JUUzJTgzJTk2JUUzJTgyJUI1JUUzJTgyJUE0JUUzJTgzJTg4JUUzJTgxJThCJUUzJTgyJTg5JUUzJTgzJTg3JUUzJTgzJUJDJUUzJTgyJUJGJUUzJTgyJTkyJUU2JThBJUJEJUU1JTg3JUJBJUUzJTgxJTk5JUUzJTgyJThCJUU5JTlBJTlCJUUzJTgxJUFFJUUzJTgwJTgxeHBhdGglRTMlODElQkUlRTMlODElQTglRTMlODIlODEmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZ0eHQtY2xpcD1lbGxpcHNpcyZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPWU2YmYyOWExMTQzOGZkYmZlNzhkMTNhMzdiNTAxYjRk%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwdGFtb25va2kmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPWExOGUyNzhiNTBiZGEzZDE1ZThiNjlhMDA1MmE3ZTM3%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D0c64a3755b82a0df3c882794ed4ac6b7)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く