nabinnoのブックマーク - はてなブックマーク

楽天市場の商品レビューをスクレイピングして全件取得 - Qiita
楽天市場のレビューのラベルと本文を全件抽出したくて書きました。 Beautifulsoupだと、Xpathを指定することができないらしいので今回はPhantomJSを使いました。 1.前準備まず、レビューを取得したいページに行きます。このページのURLをコピーします。 from selenium import webdriver import pandas as pd import time browser = webdriver.PhantomJS() url="ここにURLを入れてください" browser.get(url) page=1 columns=["score","text"] #列の作成 df=pd.DataFrame(columns=columns) path="//*[@id='revRvwSec']/div[1]/div/div[3]/div[16]/div/di
nabinno 2018/10/15
qiita

phantomjs

headless-browser

web-testing

software-testing

javascript

html
リンク
複数サイトからのTech系記事のタイトルとURLを一枚のexcelにまとめる - Qiita
初投稿です。タイトルの通り、Tech系有名サイトの新着記事タイトルとそのURLを1枚のexcelにできるコードを書きました。実行結果↓ タイトルを１枚のシートでぱっと一覧できるのっていいですね実際のコード 1.WEB_scrapingというクラスの中に４つのインスタンス変数をもつインスタンスを生成（これがクロールするサイト） import requests from bs4 import BeautifulSoup import pandas as pd #タイトル、URL、拾うタグ、classを変数にする class WEB_scraping: def __init__(self,name,url,tag,detail): self.name=name self.url=url self.tag=tag self.detail=detail #webページのHTMLをかえす def
nabinno 2018/10/07
qiita

pandas

python

data-processing

analytics
リンク
1

はてなブックマーク

タグ

ブックマーク / qiita.com/kaka__non (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / qiita.com/kaka__non (2)

楽天市場の商品レビューをスクレイピングして全件取得 - Qiita

複数サイトからのTech系記事のタイトルとURLを一枚のexcelにまとめる - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス