[B! python][BeautifulSoup] ni66lingのブックマーク

ni66ling id:ni66ling

pythonとBeautifulSoupに関するni66lingのブックマーク (4)

beautifulsoup4 Xpath指定で要素を取得 - Qiita
やり方 lxmlを使えばOK beautifulsoup単体ではXpath指定不可流れ beautifulsoupでhtmlをパースして、 lxmlで変換すると、 xpath指定できる！ import urllib2 from lxml import html from bs4 import BeautifulSoup data = urllib2.urlopen("http://example.com") soup_parsed_data = BeautifulSoup(data, 'html.parser') lxml_coverted_data = html.fromstring(str(soup_parsed_data)) # あとはお好きにどうぞ lxml_coverted_data.xpath('xxx/yyy/...')
ni66ling 2020/09/26
python

xpath

beautifulsoup

lxml

qiita
リンク
PythonとBeautiful Soupでスクレイピング - Qiita
Pythonでスクレイピングというネタはすでに世の中にもQiitaにもたくさん溢れていますが、なんとなくpyqueryが使いやすいという情報が多い気がします。個人的にはBeautiful Soupの良さも知ってもらいたいと思うのでここではBeautiful Soupを使っていきたいと思います。ちなみにこのエントリーはほとんどの部分がBeautiful Soup4のドキュメントの要約です。もっと詳しい情報が知りたい場合はドキュメントをご覧ください。英語 http://www.crummy.com/software/BeautifulSoup/bs4/doc/ 日本語 http://kondou.com/BS4/ よくある勘違い pyqueryはjQueryのようにcssセレクタを使ってHTMLを扱うことができる点がBeautiful Soupよりも使い易いという意見がありますが、それBe
ni66ling 2016/06/17
python

BeautifulSoup

qiita
リンク
Beautiful SoupでHTMLやXMLをparseしよう - そこはかとなく書くよ。
Beautiful SoupはHTMLやXMLをparseしてくれるパーサーライブラリです。でも、Beautiful Soupは単なるパーサーじゃなくてちょっと賢い奴なんです。今回、このBeautiful Soupのドキュメントを翻訳しました。 http://www.tdoc.info/beautifulsoup/ 下に軽く紹介していますが、詳しくはこのドキュメントをご覧ください。 Beautiful Soupをざっくり紹介 Beautiful Soupがどういうやつかって？例えばこんなHTMLがあったとしましょう。 <HTML> <body> 改行<br> したいよね <br/> <! --あれ、空白が入ってるちょっと変なコメント--> <p> bodyが閉じてないよ？ </html> 結構変なHTMLですよね。でも、巷にはこういうのも結構あるんです。で、これをtest1.htmlだと
ni66ling 2013/10/23
python

pip

beautifulsoup

install
リンク
はてなブログ | 無料ブログを作成しよう
オーベルジーヌ実食レポ食べ物の鼻塩塩(未だに通じるのかな) オーベルジーヌというカレーをご存知だろうか都内にあるデリバリー専門のカレー屋で、ロケ弁などで大人気の本格欧風カレーが楽しめるらしいいいな〜いいな〜オブザイヤー都内の奴らはこんな良いモン食ってんのか許せねえよ………
ni66ling 2013/10/23
beautifulsoup

python

scraping

スクレイピング
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx