スキャン本舗から送られてきた PDF ファイルは、ファイル名が丁寧にも本の題名になっていた。問題はその文字コードが Shift_JIS だったこと。Mac だと問題ないけど、Ubuntu Linux では激しく文字化けする。特に CUI で扱う場合は不便 (本当は英数字だけが理想なのだけど)。そこで、ファイル名の文字コードを変換するスクリプトを探したところ、convmv という Perl スクリプトを見つけた。 convmv - convert filenames to utf8 or any other charset via. ファイル名の文字コードを変換するには インストール convmv - convert filenames to utf8 or any other charset 本家ページから最新版 (1.14) をダウンロードする。あとは展開して PATH の通った所に置く