tyamamotoのブックマーク / 2017年3月16日 - はてなブックマーク

tyamamoto id:tyamamoto

2017年3月16日のブックマーク (1件)

SGMLReader + XPathでスクレイピングする - Sanwa Systems Tech Blog
こんにちは、今日もWebを見ながら生きているwakです。表題通りのことをやりました。はじめに目的 HTMLはXMLじゃない SgmlReader SgmlReaderの使い方導入読み込み文字列→XDocument XPathEvaluate()で型を指定する例ドキュメント全体から要素を検索するドキュメント全体から何かを検索する特定の要素の下から何かを検索する Chromeのコンソールと注意点 Chromeの$x()でお手軽XPath Chromeが勝手に要素を補う場合 SgmlReaderが補完に失敗する場合おわりにはじめに目的任意のHTMLをSystem.Xml.Linq.XDocumentに格納してXPathで目的の要素を探してスクレイピングすることです。 HTMLはXMLじゃない HTMLはXMLではありません。したがって、 <link href="myst
tyamamoto 2017/03/16
.net

c#
リンク
- 2017年3月17日
- 2017年3月16日
- 2017年3月15日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx