機械翻訳を行なっていると、部分的に翻訳したく無い箇所がある事に気がつく。 私の場合、翻訳精度を上げるために固有名詞リストを作り、翻訳にかける前に固有名詞をシリアルコードに全置換して、LanguageApp.translateで翻訳後にシリアルコードを該当言語の固有名詞に全置換するスクリプトを組んでいたのだが、翻訳後にシリアルコード部分にスペースが混入したり、さらには数字が欠落することがあった。 コードがおかしくなると当然ながら置換に失敗してしまう。 数十回に一回の割合であったが、翻訳後にシリアルコードが残ってしまうのでは大問題であった。 例 ABCD0011 このようなコードがあったとする 以下の三行のような形で余分なスペースの混入や数字の欠落が見られた。 ABCD 0011 ABCD001 ABC D0011 このような変わってはいけない文字列は翻訳対象から除外するべきであろう。 しかし