ファイル中にある「非 ASCII 文字」を含む行を検出したければ、次のコマンドで。 grep '[^ -~]' file 仕組みは ASCII文字コード - IT用語辞典 を見ると一目瞭然。 まずホワイトスペースからチルダまでを ASCII 文字とみなし、 [a-z] のノリで [ -~] とする。これで ASCII 文字からなる文にマッチする正規表現が出来る。 今回は「非 ASCII 文字」が欲しかったので ^ をつけて条件を逆転させ、完成。 ソースコード中からマルチバイト文字を取り除きたいときなどに便利。コメントを全部英語化したいときとかね。 追記 Emacs 使いの人なら M-x rgrep でこの正規表現を使うと、プロジェクトのマルチバイト文字を一括検索出来て便利。
![非 ASCII 文字を含む行を検出 - mooz deceives you](https://cdn-ak-scissors.b.st-hatena.com/image/square/fc783bcd6364a5eabd1447d263be01e8a7d78fe7/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fm%2Fmooz%2F20090814%2F20090814163548.png)