静的サイトから 30 ページぐらいのテキストを抽出して json にしたかったため、 Puppeteer でスクレイピングをすることにした。 なぜPython3 + Selenium + BeautifulSoupじゃないのか このブログがフロントエンドの備忘録のため。 Puppeteerとは https://github.com/GoogleChrome/puppeteer Chrome / Chromium を動かす Node のフレームワーク。 デフォルトは Headless(GUI を持たず、コマンドで操作できる)で、ブラウザを出しての操作も可能。 インストール てきとうなプロジェクトを作成し、Puppeteer をインストール。 const puppeteer = require('puppeteer') (async () => { const browser = await