タグ

unicodeに関するuchiuchiyamaのブックマーク (4)

  • Rails x HerokuでPDF出力した時に「𠮷」を表示する方法 - Qiita

    はじめに Railsでサービスを作っていると印刷を前提とした帳票を作ることがあります。 そんな時には、便利なGemを使えば簡単に実装することができます。 しかし、一部の文字がPDFで表示されない問題に遭遇しました。 今回はその時の解決方法を書きたいと思います。 今回の環境 PDFで表示されなかった文字は? それは、「𠮷」という文字です。 「つちよし」と呼ばれたりするようです。 「吉(きち)」ではなく、上が「土」になっています。 この「𠮷」という文字が厄介なのがWeb画面で見たときには正しく表示されます。 しかし、PDFで表示すると文字がまるごと消えてしまいます。 ※ 以下は"𠮷田士郎"さんをPDF出力した結果です。 「𠮷」という文字について 調べてわかったのが、「𠮷」はサロゲートペアという文字のようです。 サロゲートペアについては下記の記事に詳しく書かれているので読んでみてくださ

    Rails x HerokuでPDF出力した時に「𠮷」を表示する方法 - Qiita
  • 文字列の表記揺れをUnicode正規化で簡単に解決する方法 - Qiita

    ユニコード正規化をすると、半角英数字や機種依存文字などの表記が統一できます。 表記ブレが吸収されることで検索性が高まったり、データの比較なども行いやすくなります。 正規化の手法にはNFD, NFC, NFKD, NFKCがありますが、その中でもNFKCという次のような正規化を行う方法をコードを交えて紹介します。 ウ゛ェ → ヴェ ABC → ABC ① → 1 ㊤ → 上 Ⅲ → III ㌶ → ヘクタール ハンカクカナ → ハンカクカナ ﹣ → - ※ 左辺はU+FE63 Small Hyphen-Minus: 小さいハイフンマイナス - → - ※ 左辺はU+FF0D Fullwidth Hyphen-Minus: 全角ハイフンマイナス 動作環境

    文字列の表記揺れをUnicode正規化で簡単に解決する方法 - Qiita
  • wが二つ重なった文字「ʬ」がバイラビアル・パーカッシブだと調べる方法

    もともと2ちゃんねるで回答されたものみたいですが、「wが縦に二つ重なった文字の出し方教えて」という質問に対して、「ʬ」を出したり、その読み方が「バイラビアルパーカッシブ」だと回答した人はどうやって調べたんでしょうね。 そ […] もともと2ちゃんねるで回答されたものみたいですが、「wが縦に二つ重なった文字の出し方教えて」という質問に対して、「ʬ」を出したり、その読み方が「バイラビアルパーカッシブ」だと回答した人はどうやって調べたんでしょうね。 その回答者がこれを使ったかどうかはわかりませんが、ユニコード内の文字だと、ShapeCatcherというサイトで調べられます。 左側のボックスに、マウスで探したい文字を書き、”Recognize”(認識せよ)をクリックすると、下にそれに近い文字が列挙されます。wを縦に二つ書いてみましょう。 コード 0x2ac のラテン文字 bilabial perc

    wが二つ重なった文字「ʬ」がバイラビアル・パーカッシブだと調べる方法
  • http://www.macchiato.com/unicode/chart/

    uchiuchiyama
    uchiuchiyama 2007/03/12
    全角文字(1文字)をテキストボックスに入力してfindすると,Unicodeのコードポイントが分かるツール.
  • 1