はじめに Googleが提供するライブラリを使ってクローラを作りましたので、その紹介をします。 PuppeteerはGoogleが提供するNode.jsのライブラリで、ChromeまたはChromium(以下、Chrome)を自動で操作することができます。 公式ドキュメント:https://github.com/GoogleChrome/puppeteer/blob/master/docs/api.md 注意事項 岡崎市立中央図書館事件のようなクローラが関係する事件が国内で起こっているので、クローリングする際は対象サーバの負荷などに十分配慮し、自己責任で行ってください。 また、対象ページがクローリングを禁止している対象ページが、クローラのアクセスを禁止しているかはrobots.txtで調べられます。 今回クローリングする対象では https://read.amazon.co.jp/robo
![PuppeteerでKindleのハイライトを自動取得してみた - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/95ea58c16320600602742c106cd39aa231215e8a/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Fadvent-calendar-ogp-background-7940cd1c8db80a7ec40711d90f43539e.jpg%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9UHVwcGV0ZWVyJUUzJTgxJUE3S2luZGxlJUUzJTgxJUFFJUUzJTgzJThGJUUzJTgyJUE0JUUzJTgzJUE5JUUzJTgyJUE0JUUzJTgzJTg4JUUzJTgyJTkyJUU4JTg3JUFBJUU1JThCJTk1JUU1JThGJTk2JUU1JUJFJTk3JUUzJTgxJTk3JUUzJTgxJUE2JUUzJTgxJUJGJUUzJTgxJTlGJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnR4dC1jb2xvcj0lMjMzQTNDM0MmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmcz1kYzEyNTI2OWExMWY1ODIwNjAwMDU2NTI2Zjc3ODQ5Zg%26mark-x%3D120%26mark-y%3D96%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9OTcyJnR4dD0lNDBrX21vdG95YW1hJnR4dC1jb2xvcj0lMjMzQTNDM0MmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0yZTk4NDRjNTcxYTM2MjY2ZTY1MWQyMGY4MDg1NmEzZg%26blend-x%3D120%26blend-y%3D445%26blend-mode%3Dnormal%26txt64%3DaW4g44Km44Or44K344K544OG44Og44K65qCq5byP5Lya56S-%26txt-width%3D972%26txt-clip%3Dend%252Cellipsis%26txt-color%3D%25233A3C3C%26txt-font%3DHiragino%2520Sans%2520W6%26txt-size%3D36%26txt-x%3D134%26txt-y%3D546%26s%3D29b55a1cf193f0eaf748252249882a7a)