uniq -c で重複がないのを確認しようとしたら、 丸数字のところだけ違う行が同一視されてしまって、 2以上になることがあって困ったので、 原因を調べてみました。 現象 以下のように丸数字などが同一視されています。 $ cat n.txt ① ② $ LANG=ja_JP.utf8 uniq -c n.txt 2 ① $ LANG=C uniq -c n.txt 1 ① 1 ② $ uniq --version uniq (GNU coreutils) 8.20 Copyright (C) 2012 Free Software Foundation, Inc. ライセンス GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>. This is free software: you are free to