HTML::TreeBuilder で HTML 文書の断片を構文解析して元に戻すと,余計な html タグなどをつけてくれる。回避する方法はないか調べてみると,一風変わったな名前のメソッドが見つかった。 HTML::TreeBuilder の話の続き。先の記事は,HTML::TreeBuilder の出力が strict になる方法についてだった (nlog(n): HTML::TreeBuilder で構築した木が元の HTML に戻らない)。もちろん,これはオリジナルのドキュメントにちゃんと書いてある。そんなものを「再発見」してどうするのだという気もするが,嵌{はま}りやすいことでもあるので,強調しておくことに多少の意味はあるだろうということで,深く考えないことにする。さて,今回は,HTML 文書の一部 (断片) を構文解析して元に戻すと,「戻りすぎる」という話である。これもドキュメ