タグ

unicodeに関するjiangmin-altのブックマーク (9)

  • Shapecatcher: Draw the Unicode character you want!

    You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.

  • ユニコード文字名用語解説 - 世界の特殊文字ウィキ

    世界の特殊文字ウィキ ラテン文字などの拡張補助文字や人工文字、ユニコード絵文字など特殊文字に関するウィキです。 トップページページ一覧メンバー編集 ユニコード文字名用語解説 最終更新: qvarie 2008年03月15日(土) 23:13:14履歴 Tweet ユニコード文字名に使われる用語の日語訳と分析です。 構成順 英語名(Unicode) - 日語名(JIS X 0213)/IPA語名 LATIN SMALL LETTER A - A小文字/小文字のA GREEK SMALL LETTER ALPHA - ギリシア小文字ALPHA LATIN CAPITAL LETTER A - A (ラテン大文字の場合は「小文字」と付けず単に『A』と表記するが、リガチャ類は例外) CYRILLIC CAPITAL LETTER A - キリル大文字A LATIN SMALL LETTER

    ユニコード文字名用語解説 - 世界の特殊文字ウィキ
  • digitaltibetan.org

  • C#のイベントについて - 2009/12 (かー) [tabesugi.net]

    池位 他泣 /31 [4] (09:51) ふと思ったこと。「オール讀物」という書物を 「オールどくぶつ」と呼んだら、 ヘンな奴だと思われた (←慣れてますが)。 なに、小説などというものは人民を堕落させる毒物であるから、 容赦なく焚書すべきである。 今日は喪中だけど二年詣りに行っちゃうぞ。 なぜなら去年は行けてないから! へへんn (14:55) ワオ!! いつのまにか大雪!! (16:26) これはすごい雪だ。しかもぜんぜん除雪してない。 今年は大量の年賀状が投棄されるぞ、きっと。 /28 [1] (21:06) Pygame実況中継4 (Part 1〜10) 全部で2時間近くもかかっている。が、まだきちんと完成してない。 正月あけに気がむいたら続きを作る予定。 いま、この日記はじつは東京で書いていないのである。 といって実家にいるわけでもない。さてどこでしょう? きょうの教訓: 新潟

    jiangmin-alt
    jiangmin-alt 2010/03/09
    "このたび Adobe がフリーで公開した CMap table を使った文字抽出を実装していたのである。あいかわらず PDFの文字処理まわりは複雑だ"
  • javascript - encodeURIUnicode()と%uXXXX問題 : 404 Blog Not Found

    2007年03月10日17:30 カテゴリLightweight Languages javascript - encodeURIUnicode()と%uXXXX問題 これを見て、(de|en)codeURIUnicodeがあればいいと思ったので作ってみた sawatの日記 - Unicodeエスケープ なので、前述のような単に非ASCII文字をエスケープしたいだけのようなケースではUnicodeエスケープを使った方がよいです。Javaのpropertiesとかnative2asciiとかのやつです。 Decoded: Dan 弾 𪚲 Encoded: Dan%20%u5F3E%20%uD869%uDEB2 要は、U+00ffまではencodeURIComponent互換、それ以上はescape()互換というもの。こうしてencodeされたものは、CGI.pmとかでもほぼそのまま使える。

    javascript - encodeURIUnicode()と%uXXXX問題 : 404 Blog Not Found
  • https://www.orwell.ru/test/CP/_?cp1251

  • UCS-2とUTF-8

    最終更新 2003-11-11 UCSとUTF ユニコードで文書を作るとき,文字コードの方式が2種類,あるいはそれ以上あることに気が付かれるかもしれません。例えば,一つはUnicodeとあるのに対し,もう一つはUnicode (UTF-8)と表記されているかもしれません。この2つは,また,その違いは何でしょうか(前者はUTF-16の一形態なのですが…)。 UCS-2とUCS-4 ユニコードが採択されることになった多言語用の文字コードセット,ISO-10846-1は,16ビット(16桁の二進数)でそれぞれの文字を表します。それをUCS-2 (Universal Character Set coded in 2 octets,「2つのオクテットでコードされたユニバーサル文字セット」)と称します。オクテットとは文字長の単位としての8ビット(8桁の二進数)のことです。 ユニコードの特定の文字は,例

  • perl - use utf8; : 404 Blog Not Found

    2007年05月10日19:00 カテゴリLightweight Languages perl - use utf8; 添削というより、ちょうどutf8 pragmaを説明するのにいい例題なので。 はこべにっき# - Web::Scraper便利! my $left = decode_utf8('『'); my $right = decode_utf8('』'); スクリプトがUTF-8で書かれている場合は、わざわざdecode_utf8('リテラル');とするより、最初にuse utf8;としておくのが吉。 この点を明らかにするために、以下のcode snippetを示す。 #!/usr/local/bin/perl use strict; use warnings; use Encode (); use Devel::Peek; { use utf8; my $name = '小飼弾'

    perl - use utf8; : 404 Blog Not Found
  • 使いこなそうユニコード

    UCSとUTFとは? [2003-11-11] Unicode正規化とは [2008-01-14] Unicodeに関するメモ [2002-06-15] JIS X 0213とUCS/Unicodeとの対応について [2006-12-30] Unicode文字の表示例 (Unicode 4.1.0) [2005-04-23] JIS/SHIFTJISとWINDOWS/CP932との相違 [2001-07-08] JIS X 0208とUnicodeとの対応表/ZIP版 [2002-06-01] Shift_JIS-2004 (JIS X 0213:2004)とUnicode 3.2.0の対応表/ZIP版 [2007-01-03] [同じくShift_JIS-2004 (JIS X 0213:2004)とUnicode 3.2.0の対応表/非圧縮テキスト] ・JIS X 0213:2000

  • 1