最近、はてブの本文抜き出しがうまくいってないなぁと思っていたら、livedoorプロフィールが原因っぽい。 livedoorプロフィールのブログパーツは、iframで読み込む仕様なのだけど、読み込んだ先に <div id="contents">...</div> とかいうコンテンツっっぽい部分が! 404 Blog Not Found:perl - HTML::ExtractContent vs. 404 Blog Not Found に書かれているとおり、HTML::ExtractContentを使用しているとなると、そこが読み込まれてしまう可能性が高い たまに正常に本文がはてブに登録されていることもあるけれど、その時はたぶんiframの部分がタイムアウトしたかなんかで読めなかったんじゃないかと推測 とりあえずlivedoorプロフィールのブログパーツを使うのをやめてみたけど、ちゃんと取