_ [システム運用] xlhtml が巨大な HTML テーブルを吐く http://www.city.yokohama.jp/me/kenkou/iso/19data/kf-01.xls を xlhtml にかけると、248桁8451行、34MB の素敵な HTML テーブルが吐き出される。 なぜそんな Excel ファイルを作ってしまいますか…。 xlhtml のオプション -te (Trims empty rows & columns at the edges of a worksheet) をつければ改善されるかと思いきや変わらず。 仕方ないので | perl -pe 's"<TD[^>]*>( )*</TD>\n""g' | grep -v '<TR></TR>' なフィルタを通すと、34MB あった HTML は 16KB に縮んだ。(どんだけ空セル含んでたんだよ)