はじめに インターネット上で公開されている情報のほとんどはHTMLによって記述され、その情報量は膨大であり、人類が共有する資産として目を見張る物があります。 しかし、プログラム上からそれらの情報を利用する場合、一般的に、HTML内のタグや文字列を基に情報を解析する必要があるため、簡単に扱うことができません。 そこで、HTMLを現在さまざまな情報のプロトコルとして採用されているXMLへ変換することによって、情報の利用を簡便化できるHtmlConverterというクラスを紹介したいと思います。対象読者 C#を扱える方。必要な環境 VisualStudio .NET 2003以上、または .NET Framework 1.1以上がインストールされていること。概要 HtmlConverterクラスは、「ネットワーク上のURL」または「HTMLが記述されているファイル」、「HTMLで記述された文字列