今回のエンジニアブログを担当する加賀です。 個人的にXML、HTMLを扱う機会があったので、LINQ to XMLを使用してみました。 LINQ to XMLは.NET Framework 3.5以降で使用できます。 System.Xml.Linq名前空間の各クラスで構成されています。 XML文書へのアクセスを簡単に行う事が出来ます。 しかし、HTMLはそのままではLINQ to XMLでは扱えない(エスケープ文字でXMLにないものを使っているなど)ため、一度変換する必要があります。 今回はSGMLReaderというライブラリを使ってHTMLをXMLに変換することで、LINQ to XMLで使用できる形にします。 HTML to XML Sgml.SgmlReaderは、XmlReaderを継承しているので、最初に読み込む部分を作成してしまえば、後はLINQ to XMLでそのまま使う事が