タグ

Unicodeに関するtravelershouseのブックマーク (9)

  • Unicode 7.0の仕様公開 新たに約250の絵文字を追加

    Unicode Consortiumは6月16日、「Unicode 7.0」を公開したと発表した。このバージョンには2834個の新たな記号が追加されており、その中には約250個の「emoji(絵文字)」も含まれる。Unicodeには前バージョンである6.0で1000個以上の絵文字が組み込まれたが、利用できる絵文字の数がさらに増えた。

    Unicode 7.0の仕様公開 新たに約250の絵文字を追加
  • FileFormat.Info · The Digital Rosetta Stone

    FileFormat.Info is the source for file format standards, online file conversions, and detailed file specifications, including Unicode characters, MIME types and file extensions

  • 文字を上下反転させるサービス「Lunicode」のまとめ

    ご存知の方も多いと思いますが、文字を上下反転するサービス「Lunicode」の紹介です。 Lunicode 文字反転だけを紹介しているサイトが多いのですが、他にも色々な機能があるのでまとめて紹介したいと思います。 またJavaScriptライブラリがGitHubで公開されているので、利用方法についてあわせて紹介します。 1.文字を上下反転する 使い方を説明するまでもありませんが、ページ上のテキストエリアに文字を入力します。 上下反転した文字がリアルタイムに下のテキストエリアに表示されます。 上下反転した文字は、以下のようにコピー&ペーストすることができます。 ɓɟǝpɔqɐ 下のテキストエリアに文字を入力すれば、上のテキストエリアに上下反転文字が表示されます。 全角文字は対象外のようです。 2.文字を装飾する このサイトでは上下反転でなく、ミラー(裏返し)や文字装飾なども可能です。左側にあ

  • Java とサロゲートペアについて - にょきにょきブログ

    サロゲートペアを知らない人は、その挙動に戸惑うだろう。直感に反する挙動をするからだ。 次の Java コードを実行すると何が表示されるだろうか。 String val = "𠮷"; System.out.println(val.length()); val は見た目上は一文字なので 1 と表示することを期待するが、実際の結果は 2 と表示される。これは "𠮷" という文字はサロゲートペア文字で、2byte 文字では表せない文字だからである。この文字を表示するために内部では char 2つ(即ち4byte)を用いてこの一文字を表している。この「2つのcharで1つの文字を表す」文字をサロゲートペアと言う。 見た目上の文字数と内部で表される文字数が異なるため、冒頭のコードは2を返したわけだ。 さて、次のコードを実行するとエラーにならず、"𠮷" を構成する2つの文字が取得できることがわかる

    Java とサロゲートペアについて - にょきにょきブログ
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • サロゲートペア入門

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理

    サロゲートペア入門
    travelershouse
    travelershouse 2013/10/10
    なんか知識が足りてないと思ったら、なんだ文字コードからの独自の変換規則って…
  • http://propedit.appspot.com/index

  • 革命の日々! それは典型的な波ダッシュ問題ではあるまいか

    ま、波打ってる線には違いないから文句をいわれる筋合いはありませんな。 wikipediaの波ダッシュの項を見ると規格で逆向きが正しいんだ~みたいな事が書いてあるので調べてみると Unicode 3.0(ごめん最新版は持ってないの)の例示字体は確かに逆。 でもJIS X 221:1995(UnicodeのISO規格がISO10646でJIS X 221はその翻訳)ではチルダと同じ向きになっている。 JIS X 221はこの件に限らずUnicode Specificatonと細かなところが色々違うので油断できない。 はっはっは(笑い事じゃないんだけど) で、話を戻すと、WindowsフォントはUnicode式に逆向き表示。 なぜ、この逆向きっぷりが普段だれにも気づかれないかというと、Windows APIを使う限りにおいて、なぜか JIS X 208 WAVE DASH ←→ Unicode

  • そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記

    文字コードの標準化について日記を書いたのだが、内容がいまいちだったのでボツにして気を取り直してUnicodeについて一言いっておくことにする。先日、といっても昨年(2008年)の10月なんだけど、その中でちょと文字コードの標準化について話をしている。*1 もう1つ自分の経験としてあるのが、漢字の文字コードがあるんですけど、番号で言うとJIS X 0208とか0212とか規格の番号で皆言うわけなんですけど、実は1988年にその日語の文字コードの改正の委員会にいたんですね。 その当時、私は 30歳ぐらいなんですけど、「富士通」とか「日立」とか「NEC」の部長さんぐらいの偉い人たちが来てて、私なんか外資系で且つ30前後のぺーぺーだから、全然格下なんですよ。 そういうところで議論の主軸を担ってるのは、「富士通」「日立」「NEC」「日IBM」「東芝」「沖」、外資でいえば「ユニシス」とかの錚々たる

    そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記
    travelershouse
    travelershouse 2009/04/19
    「もし…していれば」、は今の携帯も同じ臭いを感じるなぁ。
  • 1