JavaにおけるHTMLパーサーといえば、jsoupやNekoHTMLなイメージだったのですが、Thymeleaf 3の 情報を知った時に、一緒にattoparserというHTMLパーサーがあることを知りました。 attoparser: powerful and easy java parser for XML and HTML markup ちょっと気になっていたので、試してみます。 attoparserとは? Thymeleafの作者である、Daniel Fernándezさんが作られているXML/HTMLパーサーです。 次のような特徴があるのだとか。 使うのが簡単 速い well-formedかどうかのチェック、ソースコードの行などの位置、元のドキュメントを再構築可能 簡素化されたパーサー(Validationや数値文字/実体参照の解決を行わない、これらは多くの場合不要) そして、S