タグ

unicodeに関するy-kobayashiのブックマーク (6)

  • フィッツパトリック制御文字 - 世界の特殊文字ウィキ

    世界の特殊文字ウィキ ラテン文字などの拡張補助文字や人工文字、ユニコード絵文字など特殊文字に関するウィキです。 トップページページ一覧メンバー編集 フィッツパトリック制御文字 最終更新: qvarie 2016年01月16日(土) 22:10:59履歴 Tweet 【ユニコード8.0以降で使用できる絵文字】カテゴリです。 ここでは人間の顔や手などの肌の色を変化させる特殊選択子である“フィッツパトリック制御記号 Skin tone Modifiers”を取り上げます。 フィッツパトリック制御記号は2015年6月17日(日時間では18日)にリリースされたユニコード8.0で導入された。 ユニコード8.0に正式採用される前の同年2月、アップル社のiOS 8.3ベータ版及びOS X 10.10.3ベータ版で使用できるようになった。ツイッターでは同年秋頃に採用されたが、合成は同年12月9日に正式採用

    フィッツパトリック制御文字 - 世界の特殊文字ウィキ
  • Swiftの文字列型 | Unicodeと文字列のUnicode表現

    ユニコード(Unicode)です。ユニコードは文字コードの規格の1つで、使うOSなどに依存しない文字を提供出来るのが特長です。Swiftの文字列型で使用されているユニコード方式は、UTF-8、UTF-16、それとユニコードスカラー(UTF-ユニコード(Unicode)です。ユニコードは文字コードの規格の1つで、使うOSなどに依存しない文字を提供出来るのが特長です。Swiftの文字列型で使用されているユニコード方式は、UTF-8、UTF-16、それとユニコードスカラー(UTF-32)です。このページで詳しく見ていきますが、実は Character 型はユニコードスカラーが1つまたは複数集まった表現です。 ここではユニコードとは何か?から始めて、ユニコードスカラーと文字列リテラル中の特殊文字について簡単に説明し、拡張書記素クラスタ(extended grapheme cluster)を紹介しま

  • [連載:正規表現] Unicode文字プロパティについて(1)|TechRacho by BPS株式会社

    はじめまして、hachi8833です。 正規表現において、使わないまま死ぬのはあまりにもったいない「Unicode文字プロパティ」について解説します。これについてネット上にまとまった情報がほとんどなく、しかたがないので自分で書くことにしました。書きながら早くも記事があふれてきたので、見出しに「連載」の文字を追加などしてみました。たぶん他所ではほとんど見かけることのない連載になると思います。よろしくお願いします。 通常の開発においては、目的を達成する正規表現を作成してコードが動けば事足りるものであり、コーディング中に正規表現と延々付き合うことは普通ないでしょう。料理人は包丁を研ぐのに時間をかけすぎないものです。しかし特殊な業界の特殊な人々(日に5人もいないと思います)は、来る日も来る日も正規表現を書き続けていたりするので、このUnicode文字プロパティは当にありがたいものです。私の場合

    [連載:正規表現] Unicode文字プロパティについて(1)|TechRacho by BPS株式会社
  • Text Escaping and Unescaping in JavaScript(Unicode の文字列をエスケープする JavaScript)

    Notes No data is sent to the server (i.e. everything is done in JavaScript). Conversion from Unicode to other encodings such as Shift_JIS can be slow first time as it needs to initialize internal conversion tables. Surrogate pairs in UTF-16 are supported. Try inserting \uD840\uDC0B in the second form. Three-byte characters in EUC-JP are not supported. Links JavaScript Unicode Charts Try GNU Libidn

  • サロゲートペア入門

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理

    サロゲートペア入門
  • いいから聞け! 俺が文字コードについて教えてやるよ その1(前提知識編) - 谷本 心 in せろ部屋

    ちょっと久々のJavaネタですが、 前から書き溜めていた、文字コードやエンコードについてのノウハウを書きます。 今回は、詳細な説明に入る前に、前提になる知識や用語について説明しておきます。 文字コードとエンコードって違うの? 新人くん「では、HTMLの文字コードはUTF-8でお願いします」 先輩社員「文字コードじゃなくてエンコーディングでしょ?」 新人くん「えっ。あぁ、はい、それで」 文字コードとエンコード(エンコーディング)を混同して使ったりすると、 ちょっと原理主義的な人に怒られたりするんですけど、 大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、 「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。 ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、 文字一覧を示す「Charset」という意味で使わ

    いいから聞け! 俺が文字コードについて教えてやるよ その1(前提知識編) - 谷本 心 in せろ部屋
  • 1