タグ

文字コードに関するworks014のブックマーク (405)

  • 「PDAM8におけるEmoticonに対する修正提案」対訳版 - もじのなまえ

    10月22日のエントリ「自分の持ち場を守ること」に、たくさんのブックマーク、はてなスターをありがとうございました。とても勇気づけられました。明日から東京会議が始まるわけですが、おそらく日程の前半でEmoji Ad hoc meeting(絵文字分科会)が開催され、そこで提案趣旨を述べることになろうかと思います。 そこで、説明のためのアンチョコとして作成した提案書の対訳版を公開します。 ここに掲載するのは、第1節「Preface(前文)」と第2節「Details of the Proposal(提案の詳細)」だけです。第3節は表ですので、これは原文をご参照ください。また、第2節を読むに当たっても、原文第3節の表を参照しながらの方が分かりやすいと思います。 - 1. Preface(前文) 1.1 Reason of This Proposal(提案する理由) We welcome the p

    「PDAM8におけるEmoticonに対する修正提案」対訳版 - もじのなまえ
  • 自分の持ち場を守ること - もじのなまえ

    どうもご無沙汰をしております。前回エントリから1ヵ月以上ですか。この間、「もじもじカフェ」があったり(たくさんの方に足を運んでいただき、ありがとうございました)、明日にはいよいよ漢字小委員会で最終答申案が発表される予定だったりと、けっして書くネタに困るような状況ではなかったのですが、ここ1ヵ月はブログどころではなかったのが実情でした。 では、なにをやっていたかというと、仲間とともに以下のような文書を作っておりました。 A Proposal to Revise a Part of Emoticons in PDAM 8[「PDAM8におけるEmoticonに対する修正提案」PDF/1.1MB] ISO/IEC 10646を審議するWG2委員会への寄書。絵文字についてです。 昨年11月にGoogle絵文字をUnicodeに収録する計画を発表しました。これは順調にすすみ、今年2月にUnicod

    自分の持ち場を守ること - もじのなまえ
  • 講習会「文字集合と文字エンコーディング」について - はてなるせだいあり

    なかなか豪快な記事(講習会「文字集合と文字エンコーディング」を開催しました — ディノオープンラボラトリ)を見つけたので、ツッコミを書いてみることにしました。ツッコミどころはかなり多いんですが、まぁ世の中の文字コードがらみの記事なんて大半がこんなものです。 「文字コード」という語は「正しい」か スライドの5ページ目は、「文字コード」という言い方は間違いという趣旨に見えますが、そうでもありません。 というのも、文字コードの世界は難しい世界です。複数のレイヤー、複数の国、複数のベンダーにまたがっているものが簡単になるはずがありません。しかし必須要素であるために、十分な知識を持たないまま、または必要性に駆られて十分な知見が集まる前に実装を行ってしまうこともしばしばあります。このことがさらに「歴史的経緯」としてさらに文字コードを難しくしています。例えばHTTPのcharsetパラメータは、char

    講習会「文字集合と文字エンコーディング」について - はてなるせだいあり
  • ÈÕ±¾¤Î¡¸�h×Ö±í¡¹¡ª¡ª¹áͨÈÕ±¾Ñ§Ï°ÆµµÀ

  • Snow Leopardの文字ビューアはどこが変わったのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Leopard以前の「文字パレット」は、Snow Leopard(Mac OS X 10.6)では「文字ビューア」になった。でもファイル名は「CharacterPalette.app」。Mac OS Xにおける「パレット」と「ビューア」の定義の違いって何なのだろう。 Leopardの文字パレットは一般的なアプリケーションのウインドウと同様、Spacesにおいて単一の操作スペースに表示されるため、操作スペースを切り替えると置き去りにされてしまい不便だった。文字ビューアはすべての操作スペースに(同時に)表示される。 文字ビューアでは「説明とコード」と記された検索フィールドが追加された(括弧内追記。いま自宅のLeopardマシンで確認したら、これ、Snow Leopardの新機能じゃないですね。「説明とコード」というテキストが表示される点は新しくて、そのせいで新機能かと早とちりしました。言い換え

    Snow Leopardの文字ビューアはどこが変わったのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 新JIS漢字実践情報

    このページでは「新JIS漢字」(JIS X 0213)を使うことに関する情報を提供 します。JIS X 0213は2000年1月に制定された新しい文字コード規格です。20 年以上の歴史を持ち非常によく普及しているJIS X 0208の拡張となっています。 以下のリストには、新しい情報を先頭に順次追加していきます。手っ取り 早くJIS X 0213を導入したい方はBDFフォント のページや「新JIS漢字時代の扉 を開こう!」をまず見るとよいでしょう。 ジャンル別リンク集 もご利用下さい。 [2005-05-29] 【このページを「文字符号化blog」へ移行】 約5年間このページでJIS X 0213の情報を提供してきましたが、 今後はblog形式に移行して、より詳細な情報をお届けしていく予定です。 文字符号化blogを是非ご購 読ください。このページは現状で凍結し、新たな情報は同blogに書

  • 文字コードについてのメモ

    JIS X 0213のあまり代表的でないかもしれない符号化方式 (2009/2) 「符号化文字集合 coded character set」という語の定義 MeadowでJIS X 0213を使う (2001/05) 波ダッシュはチルダではない (2001/03) 新JIS漢字リンク集 (2000/12) JIS X 0213の代表的な符号化方式 (2000/11) SKKでJIS X 0213を使う (2000/09) エスケープシーケンスの表。主に日語用。 そのHTML版 (2000/08) 新JIS漢字実践情報 (2000/04) (新)JIS漢字の横線を使いこなす (2000/03/27) JIS漢字とUCSの文字の対応について ウェブページを「EUC」で符号化することにつ いて 矢野啓介 <yano{AT}moon{DOT}email{DOT}ne{DOT}jp> ({AT}

  • 文字の伝統は何時から考えるか - 明窓浄机 YAMAMOMO

    2009-08-07 當山日出夫 産経新聞の8月5日の夕刊(大阪版)に書いたこと。もちろん、「新常用漢字表(仮称)」について、である。この原稿を書きながら、あるいは、書いてから、ああ、このことが実は一番大事なのに議論されていない、と感じたこと。それは、 文字の歴史的な流れとは何であるのか。たとえば、当用漢字が戦後に制定された時点から考えるのか、近代の活版印刷史にさかのぼるのか、さらには、それ以前の版や写の時代まで考えるのか。そして、最も重要なことは、現在の日語の表記を考えるときには、どの観点にたつべきかという点である。 自分で書いた文章(一太郎で残した原稿)からの引用。 どうも、これまでの「新常用漢字表(仮称)」をめぐる議論で、錯綜するのは、このあたりの論点が整理できていないからだと思う。特に、「しんにゅう」の点がどうのこうのという議論は、視点の設定によって、まったく論点が変わる。そ

    文字の伝統は何時から考えるか - 明窓浄机 YAMAMOMO
  • FILL InDesignを使ってみた - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    丸山さん(http://tama-san.com/)のFILL InDesign 0.9.6(http://tama-san.com/download.html)を使ってみた。とりあえず、InDesignの正規化がらみの「テキストペースト」機能に限定してリポート。 FILL InDesignの「テキストペースト」機能をオンにした状態でInDesignにテキストをペーストした結果が、下図右端の列。ソースのJedit Xと比較して、字形が一切変わっていないことがわかる。 前回のエントリではInDesignにテキストをペーストする際の処理について、「互換漢字を除外したNFC」が適当ではないかと書いたが、FILL InDesignはそれより一歩進んだ「合成除外文字を除外したNFC」を採用しており、オングストローム記号(U+212B)やオーム記号(U+2126)の字形も変わることがない。 Mac O

    FILL InDesignを使ってみた - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • http://viswiki.com/ja/%E4%B8%B8%E6%95%B0%E5%AD%97

  • CMapの違いについての資料を作った - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    「日語OpenTypeフォントの分裂の歴史」では、CMapの差異が生まれていく流れを描いた。では、それぞれのCMapは具体的にどう違うのか。という話は、このブログのどこかに書いてはあるのだが、散在していて参照しにくい。 で、PDFにまとめてみた。 以下追記。最新版はこちら(diff_cmap_20120906.pdf)。旧版は削除した。

    CMapの違いについての資料を作った - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 日本語 ‐ 通信用語の基礎知識

    関連ジャンル基礎知識 通信 (5046) 電話 (1645) 電子計算機 (6561) 符号 (316) 文字 (308) 符号 (266) 文字集合(CCS) (132) 日語 (42) 技術・工学 (2399) 自然科学 (8649) 人文科学・芸術 (5194) 社会科学 (607) 教育 (69) 地理 (3552) 運輸 (595) 鉄道・バス (2246) 趣味とスポーツ (1750) ゲーム (1540) 軍事 (283)

  • 文字コード委員会

    1論著 〜〜〜〜〜〜〜〜〜〜 1970年代以前 〜〜〜〜〜〜〜〜〜〜 1) 倉石武四郎:漢字の運命, 岩波新書 (1952) 2) ムーアハウス著, ねずまさし訳:文字の歴史, 岩波新書 (1956) 3) さねとうけいしゅう:中国の文字改革, くろしお出版 (1958) 4) 魚返善雄:日語心得帳, 大修館書店 (1961) 5) 藤堂明保:漢字の起源, 徳間書店 (1965) 6) 西田龍雄:生きている象形文字−モソ族の文化, 中公新書 (1966) 7) 藤堂明保ほか:言語, 中国文化叢書, 第1巻, 大修館書店 (1967) 8) 貝塚茂樹編:古代殷帝国, みすず書房 (1967) 〜〜〜〜〜〜〜〜〜〜〜 1970年代 〜〜〜〜〜〜〜〜〜〜 9) 白川静:漢字, 岩波書店 (1970) 10) 白川静:金文の世界, 東洋文庫, 平凡社 (1971) 11

  • 新漢字表試案とJIS C 6226-1978 | yasuokaの日記 | スラド

    国立国会図書館で1970年代の雑誌を漁っていたら、『漢字コード統一化をめぐって』(コンピュートピア, Vol.11, No.132 (1977年9月), pp.57-59)という記事に、以下の記述を見つけた。 JIS規格案では,基準となる漢字を二つのグループに分けている。第1水準漢字集合として2,965字,これは当用漢字(同補正案)を主として,人名用漢字別表や,当用漢字以外で広く使用されている漢字のグループである。第2水準集合は3,385字,これは第1グループよりも使用頻度は少ないが,一応必要であるという漢字で,37種類にのぼる種々の漢字に関する調査,研究書の頻度をさらに統合,これに情報処理学会標準コード用漢字表および行政情報処理用基漢字にもとづく補正を加え,選定された。この第1,第2水準のグループ分けは,確定のものではなく,正式なJIS規格発表時には,多少の変更があるかもしれない。 こ

  • JIS2004の件でマイクロソフトのコールセンターにクレーム電話入れた

    JIS2004の件でマイクロソフトのコールセンターにクレーム電話入れた スポンサードリンク Tweet M.C.P.C.: マイクロソフトにJIS2004の問題点を伝えるにはコールセンターに電話すればよかったってことか。 にて、マイクロソフトの上級部長のところには実情が全く伝わっていないっていうことがわかったので、マイクロソフトのコールセンターにクレームを入れようと思いました。 アドビと違ってさすがマイクロソフト、土曜日曜でもコールセンター受付があるのですね。というわけで、早速 マイクロソフト カスタマー サービス & サポート | 無償テクニカル サポート [www.microsoft.com] の末部に載っているフリーダイヤルの電話番号に電話をかけて、現状の問題点を伝えてきました。 僕が伝えたのは、 僕は印刷屋さん お客様の希望の通りの印刷物を作るのが仕事、よって希望通りでない製品を納

  • Unicode CJK互換漢字 F900~FAFF - CyberLibrarian

    範囲:F900~FAFF UnicodeのCJK互換漢字(The Unicode Standard CJK Compatibility Ideographs)を十六進数の数値文字参照で記述した表です。 Pronunciation variants from KS X 1001:1998(KS X 1001:1998(韓国)における発音重複に基づくもの) Unicode 表示 名称 日 韓国 備考 F900

    works014
    works014 2009/07/17
    _CJK互換漢字
  • 異体字セレクタ - Wikipedia

    異体字セレクタを付けない場合、点のある字体と点のない字体は区別されない。VS(異体字セレクタ)17を付けると点のない字体、VS18を付けると点のある字体を表す。 異体字セレクタ[注 1] [注 2] (いたいじセレクタ、英: Variation Selectors) は、Unicode および ISO/IEC 10646 (UCS) における、文字の字体をより詳細に指定するためのセレクタ (選択子) である。 解説[編集] Unicodeでは抽象的な文字を定め、個々の文字の字形の詳細には立ち入らない。このため同じ意味で似た形の文字には同じ電子的な表現が与えられ、字形の区別が必要なときはフォントの指定などによって行うのが原則である[1][注 3]。 この原則は、たとえばラテン文字の 'a' で、上部の右から左へ伸びる線があるかどうか、という違いは通常は「フォントの違い」であり「別の字」とはし

    異体字セレクタ - Wikipedia
  • 恐ろしい数の小さな防波堤によって支えられた無言の状態、というべきか - 実験る~む

    なんか乗り遅れた感があるんですが、せっかくなので。 MS、Windows 7でXPの漢字フォントと字形が統一できる 「JIS90互換フォントパッケージ」を提供(ZDNet Japan) マイクロソフト、Windows 7にもMS明朝&MSゴシックを提供 ~以降のOSからはJIS2004のみをサポート(PC Watch) マイクロソフト、JIS90互換フォントの提供はWindows 7で最後(Internet Watch) 指摘されてるのは後者の記事一番最後の記事だったりするわけですが、それについてつらつらと。 JIS2004は基的にJIS90に対する互換性があるので、一般的ユーザーにとっては、JIS90からJIS2004に切り替わることによって問題はほとんど発生しない。実際、同社コマーシャルWindows部長の中川哲氏によると、Windows XPからVistaへの移行の際に、同社

  • Microsoftが総括「Windows Vistaにフォントの混乱なし」 - もじのなまえ

    あまり時間がないので短くご報告。 Microsoftの「Windows 7向けJIS90互換フォントパッケージの提供と今後について」記者説明会に行ってきました。これについてはプレスリリースも出ています。 Windows(R) 7 向け JIS90 互換フォントパッケージの提供 より詳しくはINTERNET Watchの記事などをご参照ください。 マイクロソフト、JIS90互換フォントの提供はWindows 7で最後 細部は記事にゆずるとして、ぼくが重要だと思ったことは以下の点です。 Windows Vistaによるフォント変更について、同社コールセンターに対し、クレームの電話は1件もかかってきていない。 Microsoftは(今のところ)この件について、ユーザーに大きな混乱は発生しなかったと考えている。 Windows Vistaでフォント・デザインが変更されたことについては、2006年に

    Microsoftが総括「Windows Vistaにフォントの混乱なし」 - もじのなまえ
  • 小書きの「ヒ」と小書きの「ケ」 | yasuokaの日記 | スラド

    芝野耕司の『電子翻刻における「読み」と「見たまま」』(青空文庫オフ会、2009年7月4日)の中に、唐突に私(安岡孝一)の名が出てきたので、とりあえず全部聞いてみた。聞いていて、JIS X 0213に小書きの「ヒ」を追加した時のことを思い出したので、ここに記しておこうと思う。 JIS X 0213に小書きの「ヒ」を追加した理由の一つに、夏目漱石の作品がある。『吾輩はである』にも出てくるのだが、その時、私が注目した作品の一つが『野分』だった。春陽堂版(1908年9月)だと、p.463に「フヒヂアス式」という単語が出てくるのだが、この「ヒ」が明らかに小さい。「コスメチツク」(p.410)の「ツ」とか、「雜子ケ谷」(p.389)の「ケ」とかは全然小さくないのに、「フヒヂアス式」の「ヒ」だけが圧倒的に小さかった。 ところが、新潮文庫CD-ROM版『明治の文豪』(1997年1月)だと、「フヒジアス式