エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
SGMLReader + XPathでスクレイピングする - Sanwa Systems Tech Blog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
SGMLReader + XPathでスクレイピングする - Sanwa Systems Tech Blog
こんにちは、今日もWebを見ながら生きているwakです。表題通りのことをやりました。 はじめに 目的 HTML... こんにちは、今日もWebを見ながら生きているwakです。表題通りのことをやりました。 はじめに 目的 HTMLはXMLじゃない SgmlReader SgmlReaderの使い方 導入 読み込み 文字列→XDocument XPathEvaluate()で型を指定する 例 ドキュメント全体から要素を検索する ドキュメント全体から何かを検索する 特定の要素の下から何かを検索する Chromeのコンソールと注意点 Chromeの$x()でお手軽XPath Chromeが勝手に要素を補う場合 SgmlReaderが補完に失敗する場合 おわりに はじめに 目的 任意のHTMLをSystem.Xml.Linq.XDocumentに格納してXPathで目的の要素を探してスクレイピングすることです。 HTMLはXMLじゃない HTMLはXMLではありません。したがって、 <link href="myst