タグ

htmlに関するasitakiのブックマーク (7)

  • ブラウザってどうやって動いてるの?(モダンWEBブラウザシーンの裏側)

    どうも、鈴木です。 さて、前回は vim の使用法というじつに低レベルレイヤの出身者的な記事を書きましたが、 今回も懲りずに低レベルのお話しをしたいと思います。 というのも、先日「ブログ書くのめんどくさいよぅ」と駄々をこねていたところ、あまりにレガシーすぎる HTML/CSS/JavaScript 仕様や Flash や Silverlight といったプロプライエタリなリッチコンテンツ用プラグインに日々苦しめられている気弱く善良な一介の WEB プログラマにすぎない我々の希望の星であり、そして同時に新たな巨大クソレガシーの萌芽でもある HTML5 が、いかにイケてないのではなくイケているのであるかを盛んに啓蒙するサイトである HTML5 Rocks (http://www.html5rocks.com/) に、"How Browsers Work" というとても楽しい記事があるのを、我が

  • HTML5 における HTML4 からの変更点

    この文書「HTML 5 における HTML 4 からの変更点」は、W3C の HTML ワーキンググループ による「HTML 5 differences from HTML 4 (Working Draft 22 January 2008)」の日語訳です。 規範的な文書は原文のみとなっています。この日語訳は参考情報であり、正式な文書ではないことにご注意ください。また、翻訳において生じた誤りが含まれる可能性があります。 原文が勧告 (Recommendation) ではなく、策定途中の草案 (Working Draft) であることにご注意ください。 原文の最新版 は、この日語訳が参照した版から更新されている可能性があります。また、この日語訳自身も更新されている可能性があります。日語訳の最新版は、W3C 仕様書 日語訳一覧 から参照することができます。 更新日: 2008-09-

    asitaki
    asitaki 2008/01/23
  • HTMLのドキュメントから繰り返し部分をみつける - bits and bytes

    RSSを生成していないページからRSSを生成するなんでもRSS 0.1bは、公開されているJSAI2005: なんでもRSS - HTML文書からのRSS自動生成によると、日付情報を目印にしてそのHTMLドキュメントの構造を推測して、各エントリ(item要素)のタイトルと文を単語の統計的に処理して決定し、フィードを生成していると書かれています。 ウェブ上にあるHTMLドキュメントは Ask.jp : "xml" Search results. のように、RSSitem要素に相当する部分に日付が含まれていないものもあります。 その中でも、大量のデータを複数のページにわけて表示しているHTMLドキュメントを対象に、ドキュメント中に含まれる繰り返し部分のXPathを生成するブログラムをjavascriptで作りました。 アプローチ 大量のデータを複数のページわけて表示しているドキュメントを

  • drry+@-> Windows Live Spaces が HTML でさえないカオスを XHTML として配信している

    無駄に長いです。飛ばしエントリなので、真面目に読まないでください。 Windows Live Spaces というマイクロソフトのサービスがあります。Windows Live の一角を担い、国際化もされているそれなりに大きな規模のサービスだと思います。 さて、そのマークアップを見てみますと、これが「ボケてるんだ、ツッコんでくれよ。」と言わんばかりの、これ見よがしに異常なカオスっぷりで、HTML ではない何かを大量生産しております。何も言いますまい。釣られません。「なかなかのケイオスだ。だが断る。貴様が text/html である限り。」 どんだけカオスか気になるという人、「続きはウェブで。」 それは 4 月 22 日の深夜でした。Firefox で Windows Live Spaces のブログを開くと、XML パースエラーを起こしてしまい、正常に表示できません。もちろん以前は問題ありま

    asitaki
    asitaki 2007/05/02
  • HTMLをスクレイピングして解析(パース)する - まるさんかくしかく Tech学習と入門ログ

    Twitter Facebook B! Bookmark LINE Pocket Feedly HTMLスクレイピング(scraping)してあれこれとするとき、僕はずっと正規表現に頼っていたのですが、 ページの構造が変化するとすぐに使えなくなってしまうし、時間がかかる割りに退屈な作業なので何とかならないかなと思っていました。 PHPで探していたのですが、XML(とかRSS)をパースする関数やライブラリは、良く目にするものの、HTMLを処理できるものはなかなか見つかりませんでした。 以下は、PHP(とかRubyPerl)でHTMLスクレイピングしたりパースするための方法。 PHPスクレイピング&パース HTMLを整形式のXML文書に修正するPHPクラス HTMLを、整形式のXMLに変換してくれるライブラリ。PEARのXML_HTMLSax3が同梱されているので、これだけでちゃんと動

    HTMLをスクレイピングして解析(パース)する - まるさんかくしかく Tech学習と入門ログ
    asitaki
    asitaki 2007/04/20
  • C90%M10%Y40%: HTML売りの少女

    連載長編大河小説HTML売りの少女」 最終回 「HTMLは要りませんか?」 「HTML買ってください。」 冷たい北風が吹き荒れる街角で、今日も少女は道行く人々にHTMLを売り続けました。 「HTMLはいかがですか?」 「心のこもった暖かくて分かりやすいHTMLです。」 「Web標準準拠のHTMLは要りませんか?」 しかしすれ違う人々は冷たく少女を突き放すのでした。 「内製してるから要らないよ。」 「ブログサービスがあるからそれで充分。」 「SEO?もうたっぷりやってあるわ。」 疲れ切った少女は街の片隅に座り込んでしまいました。 少しでも暖かさを得ようと、 DreamweaverでHTMLを「ブラウザでプレビュー」しました。 一枚目のHTMLでは、 ページの中で暖かそうな家族がひとときの団欒を繰り広げていました。 二枚目のHTMLでは、おいしそう料理写真が表示されてい

    asitaki
    asitaki 2007/04/04
  • Ajax,Apache,CSS,CVS,HTML,JS,Perl,PHP等のチートシートまとめ:phpspot開発日誌

    Smashing Magazine Blog Archive Cheat Sheet Round-Up: Ajax, CSS, LaTeX, Ruby… Ajax,Apache,CSS,CVS,HTML,JS,Perl,PHP等のチートシートまとめが紹介されてます。 チートシートって印刷して貼っておくとほんとに便利でお世話になってます。 Ajax関連 What’s Ajax? Cheat Sheet - PDF Prototype Dissected - Cheat Sheet PNG scriptaculous Combination Effects - Cheat Sheet - PDF Apache関連 Apache Cheat Sheet Apache 1.3 Quick Reference Card - free quick reference cards - PDF htacc

  • 1