オヒサシブリデース。 ついにはてなブログに移行しました。インポート楽ちんでよいですね。 ここのところあんまり新しいことしてなかったので書くことなかったんですが、 久々に触ったことなかったライブラリに触ったので覚書までに。 HTMLをパースする案件がありまして、以下のパーサを触ったんですが、 割と精度も使い勝手もパフォーマンスもよかったjsoupを紹介してみます。 jsoup jericho HtmlCleaner Validator.nu HTMLEditorKit TagSoup HTML Parser NekoHtml JTidy 準備 mavenでビルドするのを想定して、まずはpom.xmlに以下を追記します。 <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7