[B! jsoup] asa_ca3のブックマーク

asa_ca3 id:asa_ca3

jsoupに関するasa_ca3のブックマーク (2)

Javaで使える、HTML5パーサ - CLOVER🍀
ちょっと大量のHTMLファイルをチェックする作業があって、grep／Perl One Linerで頑張るのも厳しいよなぁと思い、HTMLファイルをJavaでパースしてどうにかしようと思い立ちました、今日。で、JavaでHTMLパーサといえば、個人的にはパッと思い浮かぶのがNekoHTML。 CyberNeko HTML Parser http://nekohtml.sourceforge.net/ が、いかんせんこれは古い。HTML5にも対応していませんし。よって、他のパーサを探してみました。2つほど見つかったので、ご紹介します。 HTMLをパースするので、以下のような閉じタグがないHTMLもパースできなければなりません。 index.html <!DOCTYPE html> <html> <head> <title>タイトル</title> </head> <body> <div i
asa_ca3 2015/04/07
HTML

java

html5

jsoup

parser
リンク
jsoup使い方メモ - Qiita
package sample.jsoup; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class Main { public static void main(String[] args) throws IOException { Document document = Jsoup.connect("http://www.google.co.jp").get(); System.out.println(document.html()); } } <!DOCTYPE html> <html it emscope="" it emtype="http://schema.org/WebPage"> <head> <meta content="世界中のあらゆる情
asa_ca3 2015/01/09
HTML

Java

jsoup
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx