タグ

2023年4月19日のブックマーク (3件)

  • JavaScriptで濁音や半角カナの処理 - Qiita

    ひょんな拍子に、JavaScriptで「ガ」のような濁点付きの仮名を「カ」に直さないといけなくなったのですが、テーブルなしで対応できることが判明しました。 NFCとNFD 「ガ」と「ガ」、肉眼で見ればほぼ違いがないですが、データとしては全く別物になっています。 ガ…文字コードは\u30ac、濁点まで含めて1つの文字 ガ…文字コードは\u30ab\u3099、「カ+結合文字の濁点1」 このように、Unicodeでは、「複数のコードポイントを結合した文字」と「結合した状態で1つのコードポイントに登録された文字」の両方が存在していることがあります。視覚的にも意味的にも全く同じものが別なコードで表されていると(正準等価)、検索の際に厄介です。 そのようなときに役立つルールとして、Unicodeは正規化の手順も定義しています。これは4つありますが、まずは2つを取り上げます。 NFD…正準等価な文

    JavaScriptで濁音や半角カナの処理 - Qiita
  • GitHub - niwaringo/moji: 半角全角変換ライブラリ

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - niwaringo/moji: 半角全角変換ライブラリ
  • 同音異字の市町村:完全一致(市区町村雑学)

    2010年(平成22年)1月4日に愛知県みよし市が誕生し、広島県三次市、徳島県三好市を加えて、約4年ぶりの三種類の同音異字の市町村の復活です。過去には、「あいかわまち」「おぎまち」「みかわまち」「ゆきちょう」など、三種類の例がいくつかありましたが、合併の推進により次々と姿を消してしまいました。市に限ると、宮城県泉市、大阪府和泉市、鹿児島県出水市の「いずみし」以来、2例目になります(泉市は1988年/昭和63年 3月1日、仙台市に編入され泉区に)。以下、同音異字の市町村を全てリストアップします。 「みかわまち」が、2005年(平成17年)2月1日に石川県美川町が白山市の新設合併で消滅したことにより、三種類の同音異字の自治体は一時的になくなってしまいましたが、同年3月22日に岡山県美咲町が新たに誕生し、すぐに「みさきちょう」が三種類の例として復活しました。ところが、10日後の4月1日に愛媛県三

    同音異字の市町村:完全一致(市区町村雑学)