BIRTH: 7 February 1941 in New York, New York EDUCATION: Bronx High School of Science (1957); B.S. (Massachusetts Institute of Technology, Mathematics, 1960); M.S (Brandeis University, Mathematics, 1963); PhD (Brandeis University, Mathematics, 1972). EXPERIENCE: Massachusetts Computer Associates, 1970-1977; SRI International, 1977-1985; Digital Equipment Corporation and Compaq, 1985-2001; Micros
ちょっと大量のHTMLファイルをチェックする作業があって、grep/Perl One Linerで頑張るのも厳しいよなぁと思い、HTMLファイルをJavaでパースしてどうにかしようと思い立ちました、今日。 で、JavaでHTMLパーサといえば、個人的にはパッと思い浮かぶのがNekoHTML。 CyberNeko HTML Parser http://nekohtml.sourceforge.net/ が、いかんせんこれは古い。HTML5にも対応していませんし。 よって、他のパーサを探してみました。2つほど見つかったので、ご紹介します。 HTMLをパースするので、以下のような閉じタグがないHTMLもパースできなければなりません。 index.html <!DOCTYPE html> <html> <head> <title>タイトル</title> </head> <body> <div i
先ほど使ってみたDispatchですが、core以外にもいくつかモジュールがあるようで、今回はその中でも興味のあったjsoupとの連携を試してみます。 dispatch-jsoup https://github.com/dispatch/reboot/tree/master/jsoup jsoup自体は、Javaで利用可能なHTML5向けパーサです。 jsoup: Java HTML Parser http://jsoup.org/ このサイトでも、The Validator.nu HTML Parserと合わせて紹介させていただきました。 Javaで使える、HTML5パーサ http://d.hatena.ne.jp/Kazuhira/20140107/1389108413 jQueryのようなCSSセレクタで要素を選択できたりするので、便利です。 で、Dispatchのjsoup向けの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く