タグ

HTMLに関するKazumi007のブックマーク (5)

  • neue cc - C#でスクレイピング:HTMLパース(Linq to Html)のためのSGMLReader利用法

    Linq to XmlがあるならLinq to Htmlもあればいいのに!と思った皆様こんばんは。まあ、DOMでしょ?ツリーでしょ?XHTMLならそのままXDocument.Loadで行けるよね?XDocument.Parseで行けるよね? ええ、ええ、行けますとも。XHTMLなら、ね、ValidなXHTMLならね。世の中のXHTML詐称の99.99%がそのまま解析出来るわけがなく普通に落ちてくれるので、XDocumentにそのまま流しこむことは出来ないわけです(もちろん、うちのサイトも詐称ですよ!ていうかこのサイトのHTMLは酷すぎるのでそのうち何とかしたい……)。 そこでHtmlを整形してXmlに変換するツールの出番なわけですが、まず名前が上がるのがTidy、の.NET移植であるTidy.NETで、これは論外。とにかく面倒くさい上に、パースしきれてなくてXDocumentに流すと平然と

    Kazumi007
    Kazumi007 2012/11/15
    C#でもSgmlReaderを使えば、簡単にHTMLをパースできる。文字コード指定いらずなのは良いかも。
  • Beautiful Soup: We called him Tortoise because he taught us.

    You didn't write that awful page. You're just trying to get some data out of it. Beautiful Soup is here to help. Since 2004, it's been saving programmers hours or days of work on quick-turnaround screen scraping projects. Beautiful Soup is a Python library designed for quick turnaround projects like screen-scraping. Three features make it powerful: Beautiful Soup provides a few simple methods and

  • Googleが正式回答したスマホサイトのSEO - ku-sukeのブログ

    こちらの記事のざっくりまとめです Google Finally Takes A Clear Stance On Mobile SEO Practices Official Google Webmaster Central Blog: Recommendations for building smartphone-optimized websites (モバイル・スマホという言葉が出ますが、基どちらもスマホを指しています。) 結論から言うとレスポンシブデザインがSEO上はオススメ あくまでSEOの観点ですが、スマホにかぎらず様々な表示領域をもつデバイスに対応するため、レスポンシブデザイン(画面幅に合わせてレイアウトが変わる奴。)が適用できるならそれが一番いいとのこと。 ※レスポンシブデザインに関しては、日ではまだ定着していないため賛否両論があるようですが、個人的には気でやるなら有りかな

    Googleが正式回答したスマホサイトのSEO - ku-sukeのブログ
    Kazumi007
    Kazumi007 2012/11/14
    Google SEOにはレスポンシブデザインがおすすめ。
  • 『Rubyソースコード完全解説』サポートページ

    書籍『Rubyソースコード完全解説』はインプレスダイレクトで御予約・御購入いただけます。 書籍紹介ページ: http://direct.ips.co.jp/directsys/go_x_TempChoice.cfm?sh_id=EE0040&spm_id=1&GM_ID=1721 HTML 版 『Rubyソースコード完全解説』の文を HTML 形式で無償公開しています。 (2004-02-17) 全章を公開しました。 初校の修正を紙上で行ってしまったたため、現在公開しているのは初校段階の原稿です。 従って書籍では修正されているところがまだ修正されていない場合があります。 順番に修正していくつもりではいますが、いつ修正できるとは断言できません。 予め御了承願います。 なお、その逆に一部の章が出版時より新しい場合もあります。 オンラインで閲覧 tar.gz 形式でダウンロード zip 形式で

    Kazumi007
    Kazumi007 2012/11/13
    初稿段階の原稿。HTMLベース。
  • On Lisp日本語訳 草稿置き場

    On Lisp邦訳 草稿置き場 Japanese texts only! 代表的LispハッカーのPaul Graham氏がご自分のサイト www.paulgraham.com で公開なさっている著書 "On Lisp" の邦訳を,2007年3月にオーム社から出版しました. On Lisp | オーム社eStore(β) On Lisp サポートページ(practical-schemeに間借り) この"On Lisp"は草稿を公開しながら翻訳を進めてきましたが, 草稿は今後もLaTeXソースおよびPDFファイルとして公開を続けていきます. 書籍の出版に当たっては念入りのレビューにより数多くの誤り等が修正されましたが,この草稿は修正前のものです. とは言え大体は「読める」レベルです. 「いきなり買うのはためらわれるけど流し読みしたい」「内容の一部だけ参考にしたい」等の場合に役立つでしょう.

    Kazumi007
    Kazumi007 2012/11/13
    OnLispの日本語草稿。
  • 1