タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

正規化に関するpepe_la_phewのブックマーク (1)

  • Rubyでテキストの正規化(nkf)(jcode) : karari blog

    テキストを作成する人がばらばらだと、事前にちゃんとルール決めないと英数字が全角半角入り乱れてしまいますよね。全角か半角どちらかに統一されているならまだしも、ひと続きの文字列で1234567890とか混在しているのはどうやったらこう変換できるんだろうと不思議になってしまいます。 あと「カキクケコガ ギ グ ゲ ゴ」とか半角カナもDTP入稿受ける側にとってはこまりますよね。 テキストエディタで置換するのもありですが、rubyだと一撃で変換できますね。 たとえばこんな感じのスクリプトで require 'nkf' str_shiftjis = NKF.nkf('-SsXm0Z0', str) #文字の正規化(nkf)半角カナ→全角かな/全角数字→半角数字 これで半角カナを全角カナに、全角数字を半角数字に変換します。もとから全角カナ・半角数字だったものはそのまま。素敵。 あと、約物

  • 1