@IT > Insider.NET > .NET TIPS > WebBrowserコントロールによりWebページからリンクや画像を抽出するには?[2.0のみ、C#、VB] WebページのHTMLからリンク文字列(およびそのURL)や画像のURLを抜き出したい場合、単純な方法としてはHTMLドキュメントをダウンロードし、正規表現などにより<A>タグや<IMG>タグを抜き出すことができる。しかしこの方法では、HTMLドキュメントの構造が複雑であった場合や、ページ作成者のタグの閉じ忘れなどまでに対応しようとすると非常に困難になる。 そんな場合には、.NET Framework 2.0の標準コントロールであるWebBrowserコントロール(System.Windows.Forms名前空間)を利用するとよい。これはIEの描画エンジンをコントロール化したもので、対象となるWebページをこのコントロ