HTMLをパースする際、サードパーティのライブラリを利用したHTMLのパース方法はいくつか存在するが、 ここでは、JavaAPIを利用してHTMLをパースする方法を紹介したい。 今回HTMLパースに利用するJavaAPIは、ParserDelegatorというクラスである。 このクラスは、javax.swing.text.html.parserパッケージに同梱されている。 詳しくは、 ParserDelegatorのjavadoc を参照して欲しい。 ParserDelegatorに関連するクラスは、以下の通りである。 HTMLのパースに関連するクラス javax.swing.text.html.parser.ParserDelegator javax.swing.text.MutableAttributeSet javax.swing.text.html.HTML javax.swing