はじめに スクレイピングの本を読んで何かしたいなーと思ったので、その成果とやったことをまとめました。 主にはScrapyCloudの設定を書いています。 コード https://github.com/mishan88/trpgLetter やりたかったこと 某アナログゲームの"公式"の更新情報が知りたい!(Twitterとかはあるけど、シート類は公式ページにしかないので) RSSすらないサイトも多いのでスクレイピングしよう 最近流行りのサーバーレスで動かしたい インスタンスを24時間動かすのはコストがかかるので 全体概要 クローリング・スクレイピング : Scrapy + Scrapy Cloud DB : DynamoDB TODO: DynamoDBの更新情報をLambdaで受け取り、どこかに投稿 Oauthの認証周りが理解できていないので時間がかかりそう 手順 Scrapyをローカル