タグ

2008年12月18日のブックマーク (7件)

  • 2008/12/17 日記: Java: TagSoup を使った HTML正常化のサンプル

    (xhtmlではない) HTML 4.01 は、仕様として終了タグがオプションとなっているものがあります。さらに、そもそも文法的に間違った HTML が世の中に多く存在しています。(だけれども HTMLブラウザが気合いで表示しています) このような背景もあり、世の中の HTML には、結構いいかげんなものがあります。これを プログラムで読み込もうとすると、いろいろ難しいのですが、これを解決するたに、HTML正常化をおこなうツールを利用したくなることがあります。 HTML正常化を実現する OSSツールのひとつが TagSoup です。この TagSoup を使った、単純な HTML正常化サンプルを作成しました。 import java.io.IOException; import java.io.StringReader; import java.io.StringWriter

  • TagSoup home page

    TagSoup - Just Keep On Truckin' Index Introduction Taggle, a C++ port of TagSoup, available now TagSoup 1.2 released TagSoup 1.1 released What TagSoup does The TSaxon XSLT-for-HTML processor Note: TagSoup in Java 1.1 Warning: TagSoup will not build on stock Java 5.x or 6.x! TagSoup as a stand-alone program SAX features and properties Other TagSoups and related things More information Introduction

  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • ひどいHTMLをSAXパーサに読ませる (2007-08-10)

    先日取り上げたexblogのひどいHTMLを、HTML向けSAXパーサに読ませるとどうなるかの実験。startElement()やendElement()がどうコールされるかによって、パーサごとの性格が現れる。 コールバックメソッド level はネストの深さを表すインスタンス変数。 public void startElement(String uri, String localName, String qName, Attributes attrs){ for(int i = 0; i < level; i++) System.out.print(" "); System.out.print("<"+localName); for(int i = 0; i < attrs.getLength(); i++) System.out.print(" "+attrs.getQName(i)+

  • 第8回 クリティカル・パスをみつける | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    第8回 クリティカル・パスをみつける | gihyo.jp
    okinaka
    okinaka 2008/12/18
  • dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年10月時点の調査。

  • 第5回 演算子と構文 | gihyo.jp

    構文 ブロック構文 ブロック構文は波括弧でくくられた複数の式からなります。複数の式の最後の式がブロック構文の値となります。 第3回のオブジェクトの生成で、アトリビュートの初期化に次のような構文を使用しました。 リスト1 var n = 100; Foo { sum: { var tmpSum = 0; for (x in [0..n]) { tmpSum += x; } tmpSum; } } sumアトリビュートに値を代入するため、波括弧でくくられた複数の式を使用しています。これがブロック構文です。sumにはブロック構文の最後の式、つまりtmpSumの値が代入されます。 このブロック構文はアトリビュートの初期化に限らず、変数に代入することや関数の引数などにも使用することが可能です。たとえば、リスト2のスクリプトは正月までの日数の計算処理をブロック構文で実現しています(import文は省略

    第5回 演算子と構文 | gihyo.jp
    okinaka
    okinaka 2008/12/18