タグ

japaneseとITProに関するcx20のブックマーク (4)

  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
    cx20
    cx20 2009/12/11
    文書を長年保管するのであればフォントも一緒にアーカイブ(PDF のフォント埋込み?)する必要が出てくるのかも?
  • 日本語文字セットがVista最大の問題として急浮上

    「どこでどういった問題が起こるのか分からない。まさかデータベースが壊れるということはないと思うが」――。国内大手ベンダーの幹部は不安そうに話す。この幹部が懸念するのは、Windows Vistaで採用された新文字セットの情報システムへの影響である。別の大手ベンダーのシステム構築部門も、「情報システムのクライアントとしてVistaを見た場合、最大の問題は日語の文字セットだ。現在、共通の基盤技術セクションで影響を調査している」という。 企業向けVistaの出荷開始を目前に控え、Vistaの新文字セット採用が大きな問題として浮上してきた。 Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記

    日本語文字セットがVista最大の問題として急浮上
  • Windows Vistaで追加された文字の利用にはご注意

    図2●Windows Vistaで字形が追加された文字の例。字体の変更ではなく文字の追加なので,同じフォントのまま2つの字体を同時に利用できるのは一見便利なようだが,検索性などの面では不便だ。Windows VistaのMS-IMEでは,「環境依存文字」と表示される 図3●Windows Vistaで追加された文字を使った文書をWindows XPで開いたときの例。中央のVMware Workstation上で動作しているのがWindows Vista。その文書をWindows XPで開いたのが左上のメモ帳。「叱」の正字が「・」になる。だが,「剥」の正字は正しく表示される。ただし,ゴシック体に変更しても明朝体で表示される 既に報道されているとおり,Windows Vistaでは,日語の扱いについて大きく2つの変更がある。1つは,一部の文字について形(字形)が変わること。もう1つは,利用で

    Windows Vistaで追加された文字の利用にはご注意
  • “かな漢字変換ソフトの20年間”は未来へのステップ

    先日,久しぶりに言語工学研究所の国分芳宏社長を訪ねる機会があった。国分氏は今から23年前の1983年に発売された日語ワープロソフト「松」(管理工学研究所)を開発したプログラマだ。 「松」は12万8000円という価格にもかからわず大ヒットとなった製品。当時の“標準パソコン”だったNECPC-9801が備える「128Kバイト」という小さなメモリー空間で,文書作成からかな漢字変換の機能までを実現し,しかも非常に高速で使い勝手が良いということで一世を風靡(ふうび)した。 その後国分氏は,1985年に同社をスピンアウトして「言語工学研究所」を設立。それ以来20年以上にわたり,かな漢字変換ソフトの開発からスタートして,日語のテキスト音声変換,全文検索,形態素解析,シソーラスの開発などを続け,63歳になった今でも“日語”にこだわり続けている根っからのプログラマだ。取材に行くと,いつもお茶ではなく

    “かな漢字変換ソフトの20年間”は未来へのステップ
  • 1