ってことで、記念すべき第 1 回目の技術ネタ! 私は Mac から Terminal.app 使って Xen の上に居る開発マシンで vim 使ってモリモリ開発してます。 普段は文字化けとか気にせずに開発出来るように設定してるので文字コードについてはそこまで意識してません。 しかし、大量のファイルのマルチバイトな文字列を一括で置換する必要が出てきたので、対象ファイルを抽出したいなぁとか思ったわけですわ。 具体的に言うと、UTF-8 なシステム上にある EUC-JP なファイルの部分文字列引っ掛けてリストアップしたい状況なわけですよ。 まぁ、真っ先に思いつくのが「grep すりゃええやん」ってことなんですが、「マルチバイトの grep って…?」ってことで色々試行錯誤したですよ。 結果として、かなりシンプルに出来ることが判明したので、覚書。 例えば、「カレントディレクトリ以下の全ての PHP