タグ

Tipsとunicodeに関するkatowのブックマーク (10)

  • IPAexフォントと異体字 - OpenOffice.org Users Group SNS

    2月26日に独立行政法人 情報処理推進機構(IPA)が新フォントIPAexフォント」のリリースを発表しました[1]。 このフォントの特長は、なんといっても異体字(Ideographic Variation)に対応していることです。文字コードの規格「JIS X 0213」には、2000年に制定された「JIS2000」と2004年に制定された「JIS2004」があり、「IPAexフォント」の変更履歴[2]を読んでみると「JIS0213:2004制定時に字体変更された文字の旧字体を異体字として収容」と書かれています。 では、具体的に異体字はどのようにすれば表示できるのでしょう。Wikipediaの「異体字セレクタ」ページ[3]によれば、OS、フォント、アプリケーションの対応が求められています。わたしが持つ環境では、Windows 7(RC版もうすぐ期限切れ)、メモ帳が対応しているようです。そし

    katow
    katow 2011/01/06
    一番判りやすかった。Win7+異体字セレクタ対応アプリ。手元のWinXP+Office2007でIMEからバリエーションセレクター補助コードの入力ができたので、メモ帳に入力してみたが2文字が合体しなかった。WinXPのメモ帳では×。
  • 異体字セレクタ - Wikipedia

    異体字セレクタを付けない場合、点のある字体と点のない字体は区別されない。VS(異体字セレクタ)17を付けると点のない字体、VS18を付けると点のある字体を表す。 異体字セレクタ[注 1] [注 2] (いたいじセレクタ、英: Variation Selectors) は、Unicode および ISO/IEC 10646 (UCS) における、文字の字体をより詳細に指定するためのセレクタ (選択子) である。 Unicodeでは抽象的な文字を定め、個々の文字の字形の詳細には立ち入らない。このため同じ意味で似た形の文字には同じ電子的な表現が与えられ、字形の区別が必要なときはフォントの指定などによって行うのが原則である[1][注 3]。 この原則は、たとえばラテン文字の 'a' で、上部の右から左へ伸びる線があるかどうか、という違いは通常は「フォントの違い」であり「別の字」とはしないためほとん

    異体字セレクタ - Wikipedia
    katow
    katow 2011/01/06
    WindowsでUnicodeのプレーンテキストでも異体字を切り替えて用いるための技術仕様。ただし標準対応したのはWindows7からで、更にメイリオフォントが異体字非対応かつアプリ側も異体字セレクタに準拠実装する必要あり。
  • ユニコード番号から、IMEパッドで文字入力したい

    過去問がうまく調べられなかったので、改めてお尋ねします。 IMEパッドから、ユニコード番号を入力して漢字を入力する 方法があったように思うのですが思い出せません・・・。 漢籍の書名などの入力に使う、昔の漢字や異体字を入力したいのですが・・。 IMEパッドで文字一覧を選び、UNICODEを選ぶと、漢字がたぶんユニコード 番号順に表示されますが、ユニコード番号は漢字情報辞典でわかって いるので、番号から入力がしたいのです。

    ユニコード番号から、IMEパッドで文字入力したい
    katow
    katow 2011/01/06
    Unicode文字のIMEからの直接入力方法
  • 文字コードと字形 - osdev-j (MMA)

    文字情報処理 文字コード フォント .mjtの個人的メモ&某チャンネルのメモ。テンポラリ。 要点 文字コードXに対して、どういう画像を表示するのかという問題。 主に正字と略字が対立する。 JIS2004ではそうだが、基的には異体字かなぁ。 ↑ 前提 このページでは単語の定義はJISに従う。 字体:「図形文字の図形表現としての形状についての抽象的概念」 包摂:「複数の字体を区別せずに、それらに同一の面区点位置を与えることをいう」 字形:「字体を、手書き、印字、画面表示などによって実際に図形として表現したもの」 一般的には、JISの「字形」が「字体」に対応し、「字体」に対応する言葉は「文字コード(面区点位置)」? 一般には字形と字体が混同されている感はある 「字体」はabstract character、文字概念だろう。 面句点位置 = code point = 符号化文字 は 包摂された一

  • Glyph Access Protocol

    Mac OS X に含まれるフォントには、Unicode の範囲に属さない多数のグリフが用意されています。Glyph Access Protocol は、これらのエンコード対象外グリフを、アプリケーションと入力メソッドで操作できるようにします。 このテクニカルノートでは、Text Services Manager、ATSUICocoa を使用して上述のグリフをサポートする方法と、クリップボードを使用してデータ交換を行う方法について説明します。これらのサービスに対するサポートを組み込むアプリケーションおよび入力メソッドのデベロッパは、このテクニカルノートに目を通しておく必要があります。 [2003 年 5 月 6 日] はじめに Glyph Access Protocol により、アプリケーションと入力メソッドのデベロッパはエンコード対象外グリフをサポートできるようになります。この記事にお

  • [XL2002] UTF-8 形式のテキスト ファイルが文字化けする - Microsoft サポート

    上記製品の総称を以下 Excel とします。 概要 この資料は、Excel にて UTF-8 形式のテキスト ファイルを開くと文字化けが発生する動作について説明しています。 現象 Excel にて、UTF-8 形式のテキスト ファイル (拡張子 CSV や TXT) を開くと文字化けが発生します。 原因 Excel では、UTF-8 形式でテキスト ファイルを開くことができません。 状況 この現象は Excel の仕様に基づく制限事項です。 詳細 Excel でテキスト ファイルを開く場合は、以下のように動作します。 CSV ファイルの場合 ~~~~~~~~~~~~~~~~ システムの既定の言語のコード ページで開きます。 従って、日語 OS の場合は文字コード Shift-JIS でテキストを取り込みます。 そのため、それ以外の形式の文字は正しく表示できません。 HTML ファイルの場

    katow
    katow 2010/09/07
    知らんかった。2002の代ではUnicode対応してなかったのか。メインPCが2002だからちょっと困るが、サブに2003が入ってるから我慢しよう。
  • UnicodeCategory 列挙型 (System.Globalization)

    名前空間: System.Globalization アセンブリ:System.Globalization.dll アセンブリ:System.Runtime.dll アセンブリ:mscorlib.dll アセンブリ:netstandard.dll 重要 一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。 public enum class UnicodeCategory public enum UnicodeCategory [System.Serializable] public enum UnicodeCategory [System.Serializable] [System.Runtime.InteropServices.ComVisib

    UnicodeCategory 列挙型 (System.Globalization)
    katow
    katow 2010/08/14
    Unicodeの文字グループが定義されている Unicode Standard, Version 5.0
  • CJK統合漢字拡張B ‐ 通信用語の基礎知識

    辞書:通信用語の基礎知識 通信技術文字用語編 (CTCHRY) 読み:スィージェイケイ・とうごうかんじ・かくちょう・ビー 外語:Ext-B: CJK Unified Ideographs Extension B 品詞:名詞

  • UCS-2とUTF-8

    最終更新 2003-11-11 UCSとUTF ユニコードで文書を作るとき,文字コードの方式が2種類,あるいはそれ以上あることに気が付かれるかもしれません。例えば,一つはUnicodeとあるのに対し,もう一つはUnicode (UTF-8)と表記されているかもしれません。この2つは,また,その違いは何でしょうか(前者はUTF-16の一形態なのですが…)。 UCS-2とUCS-4 ユニコードが採択されることになった多言語用の文字コードセット,ISO-10846-1は,16ビット(16桁の二進数)でそれぞれの文字を表します。それをUCS-2 (Universal Character Set coded in 2 octets,「2つのオクテットでコードされたユニバーサル文字セット」)と称します。オクテットとは文字長の単位としての8ビット(8桁の二進数)のことです。 ユニコードの特定の文字は,例

    katow
    katow 2010/03/19
    やはりこれで実装すべきか。
  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • 1