[B! python][Readability] roogh5eeSha6のブックマーク

roogh5eeSha6 id:roogh5eeSha6

pythonとReadabilityに関するroogh5eeSha6のブックマーク (1)

Readabilityで本文っぽい文章を抽出 - Qiita
# ライブラリをimport from readability.readability import Document import urllib.request import html2text # 実行 url = "https://flatclub.jp/shinobiwriting/" html = urllib.request.urlopen(url).read() # 本文っぽい部分を抽出 article = Document(html).summary() # htmlからmarkdown形式に変換 text = html2text.html2text(article) # とりあえずコマンドラインに出力 print(text)
roogh5eeSha6 2020/01/27
python

Readability

本文抽出
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx