yoheiMのブックマーク / 2018年7月18日 - はてなブックマーク

yoheiM id:yoheiM

2018年7月18日のブックマーク (1件)

[Python] BeautifulSoup4で、innerHTMLとouterHTMLの取得 - YoheiM .NET
こんにちは、@yoheiMuneです。 Pythonのスクレイピングで利用するBeatifulSoup4で、innerHTMLとouterHTMLを取得する実装を行ったので、ブログにも書いておきたいと思います。目次前提例えば、以下のようなHTMLがあったとします。 <h1 class="title"> <p>サイトのタイトル<img src="logo.png" alt="logo"></p> </h1> それを、以下のように読み込んで、BeautifulSoupのインスタンスを作成し、h1を取得します。 from bs4 import BeautifulSoup html = """ <h1 class="title"> <p>サイトのタイトル<img src="logo.png" alt="logo"></p> </h1> """ soup = BeautifulSoup(htm
yoheiM 2018/07/18
BeautifulSoup4でinnerHTMLとouterHTML

Python
リンク
- 2018年8月3日
- 2018年7月18日
- 2018年7月12日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx