jericho HTML Parser http://jericho.htmlparser.net/docs/index.html DownLoad http://sourceforge.net/projects/jerichohtml/files/ JavaDoc http://jericho.htmlparser.net/docs/javadoc/index.html 何といってもjerichoの魅力は不完全な汚いHTMLでも取り出すことが容易な所が好き。 DOMを理解しているなら、基本的にタグから欲しいデータを抽出するので直感的な操作性が魅力的。 もちろんXMLも解析できる。 JavaDocに使いかたは載っているけど、軽く説明。 サンプルソース //Sourceオブジェクト生成時にアドレス、InputStream等を渡す。 Source html = new Source("http