[B! parser] atsamのブックマーク

404 お探しのページは移動、削除もしくはURLの入力間違いの可能性があります - まぐまぐ！

お探しのページは移動、削除もしくはURLの入力間違いの可能性があります。まぐまぐ！トップページの検索機能でもう一度お探しください。

atsam 2009/04/20

リンク

Blog - Mikula Beutl - SEO Consulting

This guide is the safest way to do a domain switch, you get all you need to change a blocked domain. What is a user flow and a user journey? There’s a macro view of a customer experience that we can analyze and partially control.

atsam 2009/04/20

リンク

404 お探しのページは移動、削除もしくはURLの入力間違いの可能性があります - まぐまぐ！

atsam 2009/04/20

リンク

C#でスクレイピング - DENKEN

マッシュアップで欠かせない技術の一つにスクレイピングが挙げられる。 WebAPIが提供されていないサイトに対して、HTMLから直接情報を取り出す技術だ。これには大きく分けて２つの方法がある。 HTMLをテキストとみなし、正規表現で処理する方法と、 HTMLをXHTMLに変換し、そのDOMに対してXPathで処理する方法だ。こういう分野に強いのはPHPやPerlなどの軽量スクリプト言語だろう。しかしC#使いだってスクレイピングやってみたい。というわけで、 http://d.hatena.ne.jp/todesking/20061027/1161879777を参考にやってみた。ちなみにここでやってるのは上記２つの方法のうちの後者。・・・うまくいかない。つかTidyマンドクセー！ HTMLをXHTMLに変換したいだけなのに、オプションがありすぎて意味不明です。もっと手軽なコンバー

atsam 2009/04/20

リンク

DirtyなHTMLなのにXHTMLと名乗っているページをC#でスクレイピングする - babydaemons’ blog

C#でスクレイピング - DENKENを参考にやってみた。元ネタはGoogleが吐いたHTMLを処理してたので（比較的キレイなHTMLなんだろう）、HTMLtoXHTMLは無事にXHTMLに変換できていたが、とある有名なブログのページを変換しようとしたら、XHTMLの宣言部が下記のように見事に壊れて、XDocument.Parse(xhtml)でXmlExceptionで落ちる。 <?xml version="1.0" encoding="Shift_JIS"="=" ?> <!DOCTYPE html="html" PUBLIC="PUBLIC" -="-" xmlns="http://www.w3.org/1999/xhtml" /> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja" xmlns:xm

atsam 2009/04/20

リンク

C#でスクレイピング - miKaの日記

2009/12/23 追記最下段に参考文献として、ここで紹介した以外の方法へのリンクが有ります。 C#でHTMLを読み込んで、HTMLから有益な情報を取り出したいときってありますよね。でも正規表現とかで抜き出すのってカッコ悪い、と思います。そこで、「InfoPath SDKについてるHTMLtoXHTMLというCOMコンポーネント」を使ってXPath式で情報を取得します。インストール方法は↓のURLを参照してください。 C#でスクレイピング - DENKEN 以下に実際に動くソースコードを貼っておきます。LINQとか使わない.Net Framework 2.0対応です。 using System.Xml; using HTML2XHTMLLib; namespace hogehoge { public class Hoge { /// <summary>コンストラクタ</summa

atsam 2009/04/20

c#
parser

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

parserに関するatsamのブックマーク (6)

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス