楽天市場のレビューのラベルと本文を全件抽出したくて書きました。 Beautifulsoupだと、Xpathを指定することができないらしいので今回はPhantomJSを使いました。 1.前準備 まず、レビューを取得したいページに行きます。 このページのURLをコピーします。 from selenium import webdriver import pandas as pd import time browser = webdriver.PhantomJS() url="ここにURLを入れてください" browser.get(url) page=1 columns=["score","text"] #列の作成 df=pd.DataFrame(columns=columns) path="//*[@id='revRvwSec']/div[1]/div/div[3]/div[16]/div/di
![楽天市場の商品レビューをスクレイピングして全件取得 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/9039d35c47f75576bce72f0026c01cfcb7546623/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZ0eHQ9JUU2JUE1JUJEJUU1JUE0JUE5JUU1JUI4JTgyJUU1JUEwJUI0JUUzJTgxJUFFJUU1JTk1JTg2JUU1JTkzJTgxJUUzJTgzJUFDJUUzJTgzJTkzJUUzJTgzJUE1JUUzJTgzJUJDJUUzJTgyJTkyJUUzJTgyJUI5JUUzJTgyJUFGJUUzJTgzJUFDJUUzJTgyJUE0JUUzJTgzJTk0JUUzJTgzJUIzJUUzJTgyJUIwJUUzJTgxJTk3JUUzJTgxJUE2JUU1JTg1JUE4JUU0JUJCJUI2JUU1JThGJTk2JUU1JUJFJTk3JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1hNTQ1ODNkYjQ5NzRhNmM3ZmQ1M2NhNjYxYjZhNjhiYg%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwa2FrYV9fbm9uJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1iZmEzOGIxNWZmYzRhMWM4ODAyMjcwZWZhMTZhN2JlNQ%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D6d71c6bd84c1518686a1a690ed22713b)