日本語が含まれているかどうか判定すれば良い? この時、「文字化け」している文字が混ざっているかどうか判定する方法はあるでしょうか? 結論から言うと、アルゴリズミックに確実に判定するのは不可能でしょう。一番大きな理由としては、下記の推測の過程に挙げましたが「一部の情報が欠落しているから」です。 文字化け例 ã»ã¯ã¬ã¸ããã«ã¼ã ちなみに、この文字化けはどういう原因かこれだけから推測可能ですか? 経験と勘で推測する(guess)のであれば、 ・元文字列は「・クレジットカード」 ・エンコーディングはUTF-8 ・文字化けの原因は、UTF-8のバイト列をISO-8859-1として解釈し、さらに一部の制御コードが欠落した と言うことになります。 ざっくりと、推測の過程を示しておきます。 「文字化け」の文字列をISO-8859-1(Latin1)エンコーディングでバイト列に変換してみる 日本