my $doc = $parser->parse_html_string($html, {encoding=>'utf-8'}); してから print $doc->find('//body/*')->shift->toString(0, 'utf-8'); とか。(文字列操作で前後を削るのはDOMらしくないので) / &hearts; は parse_html_string だけでも解釈できた。

kits のブックマーク 2009/04/05 15:25

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/12818252/comment/kits" data-user-id="kits" data-entry-url="https://b.hatena.ne.jp/entry/s/ziguzagu.org/2009/04/xmllibxml_html.html" data-original-href="https://ziguzagu.org/2009/04/xmllibxml_html.html" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fziguzagu.org%2F2009%2F04%2Fxmllibxml_html.html" data-user-icon="/users/kits/profile.png">XML::LibXML で HTML の一部をパースする</a><ul class="comment-tag" style="list-style: none; margin: 0px;"><li style="float: left">[<a href="https://b.hatena.ne.jp/q/perl">perl</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/xml">xml</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/html">html</a>]</li></ul><br><p style="clear: left">my $doc = $parser-&gt;parse_html_string($html, {encoding=&gt;'utf-8'}); してから print $doc-&gt;find('//body/*')-&gt;shift-&gt;toString(0, 'utf-8'); とか。(文字列操作で前後を削るのはDOMらしくないので) / &amp;hearts; は parse_html_string だけでも解釈できた。</p><a class="datetime" href="https://b.hatena.ne.jp/kits/20090405#bookmark-12818252"><span class="datetime-body">2009/04/05 15:25</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！