エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【2020年版】青空文庫から本文をスクレイピングして加工する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【2020年版】青空文庫から本文をスクレイピングして加工する - Qiita
概要 青空文庫に掲載されている作品の本文を Python でスクレイピングしていい感じに加工しました。その... 概要 青空文庫に掲載されている作品の本文を Python でスクレイピングしていい感じに加工しました。その際、ところどころハマったのでその覚書。 環境 macOS Catalina Anaconda 3系 Python 3系 Jupyter Notebook BeautifulSoup4 本文の取得 まずは青空文庫から作品の本文を取得します。 やることは基本的にこの記事(https://qiita.com/icy_mountain/items/011c9f56151b9832b54d) に書いてある通りで、[青空文庫 API(https://qiita.com/ksato9700/items/626cc82c007ba8337034) を叩いて本文の HTML をフェッチします。その際、URLの作品ID部分は book_id と変数を置くことにします。 しかし自分の環境だとこの通りにはでき