BeautifulSoupは、タグ内に'<'があると挙動がおかしくなる。 たとえばアクセス解析用とかにみるスクリプトタグかな。(GoogleAnalyticsはそこらへんちゃんとしてるね。) たとえば次のような場合: <script type="text/javascript"> <!-- document.write('<scr' + 'ipt type="text/javascr' + 'ipt" src="http://gavit.nikkei.co.jp/js.ng/cat=frttll?time=' + new Date().getTime() + '"></scr' + 'ipt>'); --> </script> こんなのがあると、 HTMLParser.HTMLParseError: bad end tag: u"", at line 186, column 141 なんて