以下の手順を、puppeteer で行う例。 Bot判定されにくくするために、puppeteer-extra と puppeteer-extra-plugin-stealth を用いる。 手順 URL のリストが入った CSVファイルの読み込み ヘッドレスブラウザの Chromium でスクレイピング HTMLファイルとして保存 1 〜 3 を CSV のデータ分、繰り返し実行 インストール npm i --save puppeteer puppeteer-extra puppeteer-extra-plugin-stealth npm i --save papaparse const puppeteer = require('puppeteer-extra'); const StealthPlugin = require('puppeteer-extra-plugin-stealth')
![Puppeteer を使ったヘッドレスブラウザによるスクレイピング](https://cdn-ak-scissors.b.st-hatena.com/image/square/4a1c69ee968c38d4ab8acce395521d01e63c9b39/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--Yq7DAZ33--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3APuppeteer%252520%2525E3%252582%252592%2525E4%2525BD%2525BF%2525E3%252581%2525A3%2525E3%252581%25259F%2525E3%252583%252598%2525E3%252583%252583%2525E3%252583%252589%2525E3%252583%2525AC%2525E3%252582%2525B9%2525E3%252583%252596%2525E3%252583%2525A9%2525E3%252582%2525A6%2525E3%252582%2525B6%2525E3%252581%2525AB%2525E3%252582%252588%2525E3%252582%25258B%2525E3%252582%2525B9%2525E3%252582%2525AF%2525E3%252583%2525AC%2525E3%252582%2525A4%2525E3%252583%252594%2525E3%252583%2525B3%2525E3%252582%2525B0%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3AYutaroITO%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyL2RjNjg4MTM2YjkuanBlZw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)