まだいまいち原因がよくわからんのだが、Mac OS X (Leopard) にあるsedにUTF-8の文字列を処理させるとやけに遅い。処理が終らん。 $ echo 'hogehoge:日本語' |\ sed -e 's/^\(.*\):\(.*\)<\/hoge>.*$/\1 \2/' なんてやってみるとマジで処理が終らん。 しょうがないのでとりあえずMacPortsからGNU sedをインストールしてみた。 $ echo 'hogehoge:日本語' |\ gsed -e 's/^\(.*\):\(.*\)<\/hoge>.*$/\1 \2/' hogehoge 日本語 一瞬で終るっ!?!? なんでやねーん。マルチバイト文字がダメなのか? $ echo 'hogehoge:nihongo' |\ sed -e 's/^\(.*\):\(.*\)<\/hoge>.*$/\1 \2/' ho