エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
(整理用) unicodeにおいて、入力フォームやデータベースの文字列処理で考慮しておきたい文字群
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
(整理用) unicodeにおいて、入力フォームやデータベースの文字列処理で考慮しておきたい文字群
サロゲートペアや合字など、通常の文字とは異なる挙動をする文字があることを聞いていた。しかし、実際... サロゲートペアや合字など、通常の文字とは異なる挙動をする文字があることを聞いていた。しかし、実際にどんな種類の文字があるか曖昧だったのでまとめた。 概念一覧 サロゲートペア 2つの文字コード値を使って、1文字を表現する 𩸽, 𠮷, 😸(😄をベースに作成), 🌕など[1] 合字 ㍻、æ など サロゲートペアとは異なり、単一の文字コード値で表現されている ただし、一部環境では未サポートで文字化けすることあり ゼロ幅接合子(ZWJ, Zero Width Joiner) ゼロ幅接合子(ZWJ)を使って、複数の絵文字から1つの絵文字を表現する。 👨👨👧👦など(環境によっては分割表示される) 異体字セレクタ バイト文字の末尾にセレクタを付けて、異字体を表現する。末尾のバイトを無視すれば、汎用されている文字になる("邉󠄂"であれば、"邉"になる) 邉󠄂 など 上記文字を扱う