概要 青空文庫に掲載されている作品の本文を Python でスクレイピングしていい感じに加工しました。その際、ところどころハマったのでその覚書。 環境 macOS Catalina Anaconda 3系 Python 3系 Jupyter Notebook BeautifulSoup4 本文の取得 まずは青空文庫から作品の本文を取得します。 やることは基本的にこの記事(https://qiita.com/icy_mountain/items/011c9f56151b9832b54d) に書いてある通りで、[青空文庫 API(https://qiita.com/ksato9700/items/626cc82c007ba8337034) を叩いて本文の HTML をフェッチします。その際、URLの作品ID部分は book_id と変数を置くことにします。 しかし自分の環境だとこの通りにはでき