タグ

unicodeに関するworks014のブックマーク (96)

  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • [PDF] ISO/IEC 10646:2017 にない日本の漢和辞典の漢字

    ISO/IEC 10646:2017 ∗ 1 2017 12 ISO/IEC 10646 (UCS) 5 CJK F 7473 UCS UCS UCS 2 UCS ( 2 ) 51110 22 UCS ∗ 135 U+21A97( ) 287 6–16215 𣤢 U+23922(𣤢) 30497 447 CJK G U+30C44 U+30A8D 3 UCS ( 1 ) 21094 171 UCS UCS 90 ad1b UCS 2537 U+2124A(𡉊) U+21264( ) 12220 U+26007( ) U+26030( ) 16876 U+4856(䡖) 4413 106870 CJK U+9FEE 2536 5451 6620 13535 18952 CJK G U+3087A U+304BB U+305B4 U+30C44 U+310D2 4 UCS ( 1 ) 1

    works014
    works014 2018/03/10
    …pdf…
  • Unicode 10.0.0、リリースされる | スラド

    昨日(6月20日)付でUnicode 10.0.0がリリースされたとの連絡を、日時間の今日(6月21日)にいただいた。今回のリリースでは8518字が追加されていて、うちCJK統合漢字拡張Fが7473字(U+2CEB0~U+2EBE0)、変体仮名が285字(U+1B002~U+1B11E)の追加である。 私(安岡孝一)個人としては、これで戸籍統一文字と住民基台帳ネットワーク文字がほぼ一段落したのがありがたいが、5月23日・24日の日記にも書いたとおり、多少、問題が積み残しとなってしまった。また、絵文字の追加(U+1F900~U+1F9E6)や、「BITCOIN SIGN」の追加(U+20BF)は、今後、微妙な禍根を残す気がしないでもない。 まあ、とりあえずは、戸籍統一文字と住基統一文字のIVS提案を、早急に進めてもらうべきかしら。

    Unicode 10.0.0、リリースされる | スラド
  • JIS X 0213コード表(1)1面1-23区 - CyberLibrarian

    文字の下の英数字は対応するUnicode番号を示し、Unicode表の各文字へリンクしてあります。リンク先のUnicode表では、JIS X 0213の非漢字の日語通用名称を「JIS名称」の欄に掲載しています。ただし、下記の「ポイント」に掲載した、Unicodeに単独の文字が登録されていない25字の非漢字は、「ポイント」の各文字へリンクしてあります。 面区 点 JIS SJIS EUC +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 1面1区 0 2120 813F A1A0

  • スペース - Wikipedia

    この項目では、言語の表記に使われる空白について説明しています。技術的な文字のスペースについては「空白文字」を、その他の用法については「スペース (曖昧さ回避)」をご覧ください。 スペース(英: space)は、ラテン文字、ギリシア文字、キリル文字などにおいて、語と語の区切りを表すために空ける空白、またその他の字間の空白のことである。 ヘブライ語やアラビア語においては、早い時期から単語の区切りを表すのに空白が置かれていた。ラテン文字で最初に使われたのはアイルランド語で、時期は600年から800年頃と考えられている。それまでラテン文字では中黒が使われていた。 ラテン文字におけるスペース[編集] ラテン文字においては、語と語の間にスペースが置かれる。手書き文字では、間を空けるほか、筆記体では続けて書かない。印刷・組版などの場合、印字エリアの右端をそろえる「ジャスティフィケーション」のためには、ス

    works014
    works014 2016/06/15
    …スペース…
  • UnicodeのU+0020とU+00A0( )は別物である|mattintosh note (跡地)

    ​ Unicodeにはスペースが複数ありますが、その中でもU+0020とU+00A0の違いについてです。 HTMLでもよく使われる はU+00A0の方です。両者の違いは見ていただいた方がわかりやすいでしょう。 キーボード全角スペース a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a キーボード半角スペース a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a U+0020 (SPACE) a a a a a a

    works014
    works014 2016/06/15
    …スペース…
  • 変な文字化け - にせねこメモ

    奇妙な文字化けがあった(ことを思い出した)のでメモしておく。 きっかけはこのツイート。twitpicの画像をご覧いただきたい。 何なのこいつ何を入れさせるつもりなの http://t.co/dYFVynv— シェゴ (@syego) September 3, 2011 twitter.com 「悰しい悰惴が倩瀨僯能です」は「新しい更新が利用可能です」が化けた物ではないか。下表にUnicodeスカラ値を示す。 悰 し い 惴 悰 が 60B0 3057 3044 60F4 60B0 304C 新 し い 更 新 が 65B0 3057 3044 66F4 65B0 304C 倩 瀨 僯 能 で す 5029 7028 50EF 80FD 3067 3059 利 用 可 能 で す 5229 7528 53EF 80FD 3067 3059 Unicodeスカラ値を見ると、0x100の位が0に

    変な文字化け - にせねこメモ
  • ハイフンとかダッシュとかUnicodeにあるたくさんの横線(全135文字)

    鈴木です。ラズパイ部がやや休止中気味です。私の久しぶりの記事は、Unicodeにある横棒のコレクションです。 ハイフンとかダッシュとか、半角と全角とか、複数あることはご存じの方も多いと思います。Shift-JISとの変換で悩まされるケースもありますよね。 Unicodeにあるハイフンとかマイナスとかダッシュとか、横線に見える文字をある程度を一覧にしたブログなどはたくさん見つかるのですが、結構漏れがあったりします。自分で納得できるレベルにまで網羅した横線一覧がなかなか見つからなかったので、自分で作りました。せっかくなのでここに公開しておきます。 ハイフンやカタカナの長音記号など、直線が横に延びているものが対象で、縦方向や斜めの線は除きます。 ほとんど横方向だけどちょっとだけ傾いているものや、端にちょっとしたハネとかうろことか付いているもの、太さが途中で変わっているものは含めました。横線の場所

    ハイフンとかダッシュとかUnicodeにあるたくさんの横線(全135文字)
  • Unicodeとは(草稿) | 電子書籍、電子出版のCAS-UBブログ

    JEPAサイトで完成版公開 Unicode Unicodeは、Unicodeコンソーシアムという業界団体が定める、地球上の全ての文字を網羅する符号化文字集合(文字コード)である。Unicodeが普及する前は地域・国別に標準化された文字コードが使われていた。地域別に文字コードが異なるとコンピュータ・ソフトウェアのローカライズで、基的なテキスト処理を地域毎に変更しなければならない。この問題を解消するためプログラムの文字処理用にUnicodeが開発されたが、インターネットの普及に伴い、HTMLやXMLのテキスト用文字コードとしても使われるようになり、現在は最もポピュラーな文字コードになった。 Unicodeの歴史 ゼロックスはStarの日版J-Star、アップルはKanji Talk(Macintoshの日語環境)を作る過程で、日語化の問題に直面した。こんなことから両社でUnicodeの

  • UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由 

    UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由 
  • http://www.marathon-studios.com/unicode/

  • Unicode一覧表

    Unicode(UTF-8)の文字コード表を出力します。区分名に「*」が付いているものは合成用文字です。 表示: 【使い方】 左肩の区分メニューをクリックすると、その区分にある文字を一覧表で表示します。 一覧表の文字やコード番号をクリックすることで、上記フォームに文字が入力表示されます。 様々な機器で見比べることでフォントの違いを比較することが出来ます。 ブラウザの設定や、OSに組み込まれたフォントの仕様によって表示される文字が異なります。 文字コードを調べたいときは、フォームに文字を入力し、検査ボタンを押してください。 コード表の右上にあるURLをクリックするとURLの後ろに#で始まるハッシュがつきます。そのURLをブックマークすることで、表示の区分を直接開くことが出来ます。 【ご注意】 全コードの出力はかなり大きな表となるため、ブラウザの動作が遅くなったり、動かなくなる場合があります。

  • 2014.12.10 アップデート「漢字データベースとユニコード」 - JEPA

    Unicodeと漢字関連の最近の動きをご紹介するセミナーです。「文字フォント、文字コードはICTの米」ですので、電子出版関係者、漢字、辞書関係者は必見。 ■概要と講師 ●はじめに 小林 龍生 氏 (JEPAフェロー、CITPC理事)  講師紹介、互換漢字とSVS(Stabilized Variation Sequence)など

  • 文字コード地獄秘話 第2話:聖母マリアよ、二人を何故別々に? | ALBERT Engineer Blog

    はじめに 二人を最初から一つにしておけば、何も問題など起こらなかったのだ。 一つのものを二つに分けたその時から、長い物語が始まる。 おや?また会いましたね。どうも、文字コードおじさんです。 もう半年近くも前になりますが、前回の投稿はだいぶ反響があったようで驚いております。ありがとうございます。 今回も文字コードネタですが、Unicodeにおける結合文字列を取り上げてみようと思います。 高度に発達した文字コードは地獄と見分けがつかない 次の画像はTwitterの投稿フォームですが、おかしな点があります。わかりますか? そうです。4文字しか入力していないはずなのに 5文字分とカウント されていますね。おかしいと思いませんか?あなた? 改行とかスペース入れてるんじゃねーだろうな?とか言わないで下さいね? さらに次の画像を見てみてください。 こちらは4文字とカウントされていますね。先のものとは一体

    文字コード地獄秘話 第2話:聖母マリアよ、二人を何故別々に? | ALBERT Engineer Blog
  • U+FFFF以上の文字ってなんや → サロゲートペアってなんや → Spring Web Services が言うことを聞きません! とかで一日潰れた話 - エンジニア的なネタを毎週書くブログ

    表題のような感じなのですが、これまで理解が曖昧だったUnicodeとか何とかが今までよりわかったのでメモ。 尚、こちらのサイトを非常に参考にさせていただきました。 Unicodeについて コードポイントとは 文字コードとは 今日覚えた単語その一。Unicodeに限らず、文字をコンピュータ上で表現する際、1つの文字に1つの数値を対応させるわけですが、この文字に対応する数値をコードポイントというそう。 いままでASCIIコードとか呼んでました。 そして、文字と数値の割り当てのルールのことを「文字コード」と言うんだそうです。 Unicodeとは から UTF-XXは何が違うんじゃ という話へ Unicode誕生 文字コードが乱立したため、あるコードポイントで表現される文字が、文字コードによって、てんでばらばらという状況に。 ややこしいから、ひとつの統一した文字コードをつくろう! ということで「U

    U+FFFF以上の文字ってなんや → サロゲートペアってなんや → Spring Web Services が言うことを聞きません! とかで一日潰れた話 - エンジニア的なネタを毎週書くブログ
  • 「絵文字に平等をサポートしてください」人種差別の指摘にゆれるUnicode 

  • 漢これ - 漢字これくしょん

    まずはUnicodeの漢字にどのようなものがあるのか、コード表で確認しましょう。 Unicodeコード表 膨大な漢字を正しく表示するには、対応フォントが必要です。ここでは漢字の揃ってるフリーフォントを紹介します。 全てのUnicode漢字を含む 花園明朝フォント Adobeが開発したオープンソースのSource Han Sans (源ノ角)フォント IPAの戸籍・登記に対応したフォントIPAmj明朝フォント 漢字をただ眺めるための電子書籍です。いくつか種類がありますが、それぞれ収録漢字が違ったりフォントが違ったりします。EPUBがダウンロード可能な他、iBooksとKoboの電子書籍ストアでも無料ダウンロード可能です。 EPUBファイルはダウンロードして、お好みのEPUBリーダでご覧ください。フォント埋め込みのものは、対応するリーダで見る必要があります。iBooks /Kobo(iOS,A

    漢これ - 漢字これくしょん
  • 文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog

    ごあいさつ 皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。 今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。 固定観念を捨てよう 「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。 特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。 このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。 しか

    文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog
  • http://atnd.org/event/cjk

    http://atnd.org/event/cjk
    works014
    works014 2014/02/13
    …こんなんあるよ…
  • 【第396回】「ものかのさん囲んでUnicode正規化について聞く会」 : イジハピ!

    2013年07月22日11:00 【第396回】「ものかのさん囲んでUnicode正規化について聞く会」 カテゴリ query1000 Comment(0)Trackback(0) ★来週、7/29から8/2までブログはお休みします 7月20日土曜日、また文字コードの宴会に参加した。 お題は「MacのHFS+でUnicodeの正規化が変になる件について」。 普通そんなことで飲み会しますか。 MacのHFS+でUnicodeの正規化が変になる件とは何か。 参考ページ(ものかのさんのブログ) Unicodeの合成除外とHFS+の正規化 Unicode正規化 用語の混乱について Unicode正規化 ここだけ読んでスッキリした人は、今日のエントリーを読み飛ばしてもいいかもしれない。 以下は屋上屋を架すというか、ぼくなりに説明を(主に自分自身に対して)試みてみる。 たとえばMacで「が」という字

    【第396回】「ものかのさん囲んでUnicode正規化について聞く会」 : イジハピ!