タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

正規表現とunicodeに関するtimetrainのブックマーク (1)

  • 不必要な制御文字への対処 - pixiv inside

    こんにちは、晴れて2020新卒になったmipsparcです。最近は趣味の鉄道技術同人誌の新版が出来上がって喜んでいます。 記事では、入力値には必ずと言っていいほど混入する不必要な制御文字への対処方法をご紹介します。ユーザーに文字列を入力してもらうことのあるすべてのサービスで活用できる話かと思います。 不要な制御文字が入ることで生じる問題 前提として、この記事は制御文字類が必ずしも邪魔と言いたいわけではありません。 制御文字は多言語対応(特に右から左方向に記述する言語)などで重要なときもありますが、今回は問題が発生しうるケースのお話をします。 「‪腐向け」 「メリークリスマス‬」 「ゾンビ」 なんの変哲もない3つのイラストタグですが、どれも不可視の制御文字が混入しています。 $ php -r "var_dump(json_encode('腐向け'));" string(26) ""\u2

    不必要な制御文字への対処 - pixiv inside
    timetrain
    timetrain 2020/05/14
    見た目はちゃんとタグを入力してるはずなのに、はあるよね。昔から「へ」と「ヘ」、「べ」と「ベ」、「ぺ」と「ペ」問題とかあるけどさ。前者はひらがな、後者はかたかな
  • 1