タグ

ブックマーク / mika.hatenadiary.org (1)

  • C#でスクレイピング - miKaの日記

    2009/12/23 追記 最下段に参考文献として、ここで紹介した以外の方法へのリンクが有ります。 C#でHTMLを読み込んで、HTMLから有益な情報を取り出したいときってありますよね。 でも正規表現とかで抜き出すのってカッコ悪い、と思います。 そこで、「InfoPath SDKについてるHTMLtoXHTMLというCOMコンポーネント」を使ってXPath式で情報を取得します。 インストール方法は↓のURLを参照してください。 C#でスクレイピング - DENKEN 以下に実際に動くソースコードを貼っておきます。LINQとか使わない.Net Framework 2.0対応です。 using System.Xml; using HTML2XHTMLLib; namespace hogehoge { public class Hoge { /// <summary>コンストラクタ</summa

    C#でスクレイピング - miKaの日記
  • 1