こんにちは、今日もWebを見ながら生きているwakです。表題通りのことをやりました。 はじめに 目的 HTMLはXMLじゃない SgmlReader SgmlReaderの使い方 導入 読み込み 文字列→XDocument XPathEvaluate()で型を指定する 例 ドキュメント全体から要素を検索する ドキュメント全体から何かを検索する 特定の要素の下から何かを検索する Chromeのコンソールと注意点 Chromeの$x()でお手軽XPath Chromeが勝手に要素を補う場合 SgmlReaderが補完に失敗する場合 おわりに はじめに 目的 任意のHTMLをSystem.Xml.Linq.XDocumentに格納してXPathで目的の要素を探してスクレイピングすることです。 HTMLはXMLじゃない HTMLはXMLではありません。したがって、 <link href="myst