HTMLをテキストとみなし、正規表現で処理する方法と、HTMLをXHTMLに変換し、そのDOMに対してXPathで処理する方法だ。

WackyWacky のブックマーク 2008/02/29 22:55

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

C#でスクレイピング - DENKEN

    マッシュアップで欠かせない技術の一つにスクレイピングが挙げられる。 WebAPIが提供されていないサイトに対して、HTMLから直接情報を取り出す技術だ。 これには大きく分けて2つの方法がある。 HTMLをテキストと...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう