タグ

unicodeに関するxiaodongのブックマーク (29)

  • 住民基本台帳ネットワーク統一文字とその問題点

    住民基台帳ネットワーク統一文字は,当初はUCS(国際符号化文字集合)を拡張する形で設計されており,いかなるコンピューターでも使用できるオープンなシステムを目指したはずだった。しかし,UCSの基設計に対する誤解や,その後のUCSの変化に十分追随できなかったために,住民基台帳ネットワーク統一文字は,もはや現代のOS上では動作しない文字コードになってしまっている。稿では,住民基台帳ネットワーク統一文字の問題点と,その問題点を踏まえた上での今後の方策について述べる。

  • 《Unicode/CJK統合漢字》漢字検索

    《Unicode/CJK統合漢字》 漢字検索 このページは、UnicodeのCJK統合漢字(CJK統合拡張A・B・Cを含む)及びCJK互換・CJK互換補助漢字について、各種文字コードや代表的な音訓読みなど、主に情報システムでの漢字の利用に役立つ情報を検索できるようにしたものです。 ◆漢字部首検索 左側のフレームに表示される漢字の部首一覧から探したい漢字の部首を選択してください。 右側のフレームに部首を除く画数順の漢字の一覧表が表示されます。 ◆漢字画数検索 左側のフレームに表示される漢字の画数一覧から探したい漢字の総画数を選択してください。 右側のフレームに部首順の漢字の一覧表が表示されます。 ◆漢字読み検索 左側のフレームに表示された漢字の読み一覧から探したい漢字の読みの頭文字を選択してください。 右側のフレームに音訓混合の読み順に漢字の一覧表が表示されます。 ◆漢字コード検索 左側のフ

  • 【第252回】「文字研究会」ワークショップに参加した : イジハピ!

    2013年01月01日06:00 【第252回】「文字研究会」ワークショップに参加した カテゴリ思い出・雑記文字コード【プチ】研究 query1000 Comment(0)Trackback(0) 報告が遅くなったが、2012年12月22日(土曜日)に、品川の京都大学東京オフィスで開かれた、「文字研究会」のワークショップ、「第7回ワークショップ: 文字——ISO/IEC 10646とUnicodeの今——」に行ってきた。 ぼくは、こういうワークショップ等にほとんどまったく行かない方だ。 今回はツイッターで知己を得た小形さんが講演をされ、参加を広く呼び掛けておられたので、奮って参加することとした。 「文字クラスタ」の方がたともご挨拶できて楽しかった。 企画は安岡孝一さん。一日座って聞いていれば、ここ数年のISO/IEC 10646/Unicodeのトピックが、全て分かる構成になっております。

    【第252回】「文字研究会」ワークショップに参加した : イジハピ!
  • 変体仮名符号化の是非を考えるメモ - 楷書活字(新居)

    年の終りに考えを整理しておく。 変体仮名を機械可読な符号として標準化することについて、私的な結論を出しておこうということだ。 変体仮名とは 現在用いられている仮名と同じ音を表しながら形状が異なる仮名。かつては(明治まで)用いられていたものである。 明治初期には鋳造活字も作られ、印刷・出版に用いられていたが、20世紀になると教科書での使用が制限されると同時に印刷工程の合理化の要請もあって(原稿では使用されていても)出版物からは姿を消した。 現在見ることができるのは、書道作品、商家の看板、昭和初期までに生まれた人の名前などでしかない。これらに用いられている場合も、一般には通常の仮名もしくは漢字に置き換えて表記される。 従って、現代日語の表記のためには変体仮名は全く不要であるから、JISは標準化を見送っているし、それで問題ない。 しかし、Unicodeとなると話が変わってくる。Unicodeは

    変体仮名符号化の是非を考えるメモ - 楷書活字(新居)
  • 情報交換用符号化文字集合と人名用漢字使用の実情

    Online ISSN : 1347-1597 Print ISSN : 0021-7298 ISSN-L : 0021-7298

    xiaodong
    xiaodong 2012/06/18
    小林 龍生. 情報交換用符号化文字集合と人名用漢字使用の実情. 情報管理. Vol. 55 (2012) No. 3 P 147-156
  • Appleカラー絵文字文字コード表(UTF-16) - mixi engineer blog

    期末のお忙しいところ失礼致します。iPhoneアプリ開発担当の七尾です。 iOS5がリリースされてしばらく経ちましたが、iOS5の新機能のひとつである、Appleカラー絵文字についてUTF-16な文字コード表を作りましたので、お知らせ致します。 iOS Emoji - GitHub Pages テーブルの横幅が大きくなってしまったので、GitHub Pagesに乗せてしまいました。 また、画像数が多いので、GitHub Pagesで公開しているものは、カテゴリごとのhtmlに分割しています。統合版htmlはmasterブランチに入っていますので、必要な方はそちらをご利用ください。 iOS5からどこでも入力できるようになった絵文字は見た目はSoftbankのUnicode絵文字ですが、実体はAppleカラー絵文字(Unicode6互換)に変わっています。 ちなみに従来のSoftbank Un

    Appleカラー絵文字文字コード表(UTF-16) - mixi engineer blog
  • 「絵文字」文化が米国でも広がる iPhone普及で

    発の文化emoji」(絵文字)が米国でも浸透し始めていると、このほどNew York Timesが報じた。AppleがiOS 5の英語版でも絵文字キーボードを使えるようにしたためで、メールなどで「ちょっとした気持ち」を加えて伝えることができるとして米国ユーザーが使い始めているという。 iOS 5英語版では、設定によって絵文字用のキーボードが選択できるようになった。記事では友達とのやり取りに絵文字を使う学生や、9歳の子どもと絵文字入りメールでコミュニケーションしている39歳の法律家の男性を紹介。「会話で使われる身振り手振りのようなものだ」という米国のメディア研究者の見方を紹介している。 またこの研究者は、Apple英語版で絵文字キーボードを使えるようにしたのは、iPhoneならではのモバイル文化を作りたいAppleのビジネス戦略に基づくものではないか、という。 ただ、絵文字は日で生

    「絵文字」文化が米国でも広がる iPhone普及で
  • 近デジのテキスト化について、@aobekaさんのつぶやきまとめ

    国立国会図書館「近代デジタルライブラリー」のテキスト化に関する @aobeka さんのつぶやきをまとめてみました。 「日語のテキスト化は難しい。けれど誰もが、そこに大きな可能性をみています。貴館が、足取り確かに、前進されますように。」という最後のつぶやきが心に残りました。

    近デジのテキスト化について、@aobekaさんのつぶやきまとめ
  • 漢字データベースプロジェクト

    概要 『漢字データベースプロジェクト』は、Unicode / UCS (Universal Multiple-Octet Coded Character Sets) によって符号化された漢字(CJK統合漢字)の情報交換・検索照合・分析に役立つ様々なデータベースを整備することを目的に、2003年度に日学術振興会科学研究費補助金・研究成果公開促進費(データベース)の援助を受けて開始しました。 各種漢字データファイルは、GitHubにて管理されており、GitHubサーバから取得することができます。 ライセンスについて プロジェクトのデータは、GPLライセンスおよびMITライセンスにて配布しています。 GPLライセンスによる配布 IDSデータ(ids.txt) 説文解字注(六書音均表等を含む)データ 宋廣韻データ 學生字典データ MITライセンスによる配布 上記以外のすべてのデータ(以下を含

  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • 「Unicode 6.0」が策定、絵文字が国際標準に 

  • johokanri.jp

    johokanri.jp 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • 特別企画 第12回Unicode国際カンファレンスから

    特別企画 第12回Unicode国際カンファレンスから 漢字文化は危なくない 見えてきたUnicode3.0 JavaやXMLでの採用,インターネットの普及と相まってUnicode普及の勢いは,すでにとどめがたい。世界中の文字を一元的,統一的にコンピュータで扱うための文字コードという理念でスタートしたUnicodeだが,扱える文字数の少なさや,中国韓国,日で使われている漢字を,似た字形のものを統合したことなどから,米私企業のエゴによる漢字文化の侵略,などと批判を受けることも多かった。しかし,Unicode3.0策定に向けて欠点は改善されつつある。Unicodeの何が問題とされ,どう解決されてきたのだろうか。 ここでは4月8日〜10日の3日間,東京の品川で開催された第12回Unicode国際カンファレンスから,主に一般向けチュートリアルをもとに,Unicodeの最新動向についてお

  • 特集 : 絵文字が開いてしまった「パンドラの箱」

    The Japanese edition of 'CNET' is published under license from A Red Ventures Company., Fort Mill, SC, USA. Editorial items appearing in 'CNET Japan' that were originally published in the US Edition of 'CNET', 'ZDNET' and 'CNET News.com' are the copyright properties of A Red Ventures Company. or its suppliers. Copyright (c) A Red Ventures Company. All Rights Reserved. 'CNET', 'ZDNET' and 'CNET New

    特集 : 絵文字が開いてしまった「パンドラの箱」
  • 絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ

    WG 2ダブリン会議に持ち込まれた絵文字の提案 2009年4月21日火曜日、ここはイギリスのお隣、アイルランドの首都ダブリン郊外です。広大なキャンパスをかまえるダブリン・シティ大学の一画では、前日から11カ国のナショナルボディ(以下、NB)と2つの組織のリエゾンメンバー(連絡担当会員)が集まって、第54回WG 2会議が開かれていました。 大学の正門から真っ直ぐに延びた広い道を100メートルばかり行った突き当たりに、巨大なる工学部校舎が建っています。その建物の奥深く、2階にあるミーティングルームでは、先ほどから重苦しい空気が立ちこめていました。 ここで開かれていたのはWG 2の会議ではなく、特定のテーマを扱うアドホック会議です。「Ad-Hoc Committee on Emoji Encoding」(以下、Emojiアドホック会議)。──そう、2月のUTC会議を無事に通過したGoogle

    絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ
    xiaodong
    xiaodong 2010/01/30
    文字をunicodeに含めるか否かでそれぞれの思惑が交差する駆け引きがすごい。/Twitterで絵文字が使用できるようになったら140字以上のメッセージが伝えられそう。
  • 漢字1文字が最大8バイト、Unicodeの「IVS」とは?

    「漢字1文字は2バイト」という常識が、大きく変わろうとしている。現在改正中の「常用漢字表」に対応するためには、Unicodeの4バイト文字を使用する必要があるが、それだけでは済まない恐れがある。今後、戸籍や住民基台帳で使われている文字がUnicodeに追加されると、漢字1文字が最大8バイトになるかもしれない。文字コードに詳しい京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。(日経コンピュータ) 先日公開した『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』の読者から、「今後のシステムでは漢字1文字を最大4バイトで処理すればいいのか」という質問を頂いた。実は、UTF-8あるいはUTF-16で漢字を表す場合、最新のUnicodeにおけるIVS(Ideographic Variation Sequence)を考慮すると、漢

    漢字1文字が最大8バイト、Unicodeの「IVS」とは?
  • 電子ブックに完全移行できない場合 - 天漢日乗

    全盲やかなりの弱視のヒトとデータをやりとりする場合にわたしは困ることがよくある。 Unicodeで処理できない漢字 が含まれるからだ。全盲やかなりの弱視だと そこだけ画像データにして渡す というわけにも行かない。ましてや、 音声データとして出力されない程度の漢字 はいくつもある。従って、漢字の形を認識できない程度の視力になっている視覚障碍者は最初から ある程度以上のレベルのコードの漢字や、異体字や冷僻字のある文書を扱えない のである。異体字は普段使っている漢字に交換可能だが、冷僻字はそうはいかない。 いま 電子ブックが世界を変える という話になっているのだが、それでOKなのは Unicode内で処理できる場合 で、日語の文献はそれでははみ出る場合が出てくる。中国語もそうだ。すべての冷僻字(滅多に使わない漢字)にコードが振られているわけではないから、どうしても落ちこぼれる文字は出てくる。

    電子ブックに完全移行できない場合 - 天漢日乗
  • 【新常用漢字表(仮)】携帯電話にもUnicode実装を促す「改定常用漢字表」 

  • 【改定常用漢字表試案への意見】テンプレート | yasuokaの日記 | スラド

    『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』の読者から、「改定常用漢字表試案への意見」の例を書いてほしい、という依頼がかなりたくさん届いた。しかも、電子メールで送れる形にしてほしい、という人が多いらしい。とりあえず、私(安岡孝一)なりのテンプレートを書いてみることにした。 To: kanzihyo@bunka.go.jp Subject: 【改定常用漢字表試案への意見】 氏名・年齢・性別・職業 住所・電話番号 「叱・填・剥・頬」の4字を、それぞれ対応する常用漢字の許容字体として、角括弧つきで併記することを要望します。また、*が付された「彙・茨・淫・牙・葛・韓・嗅・僅・惧・稽・恣・煎・詮・箋・嘲・捗・溺・賭・箸・蔑・喩」の21字および「羨・蔽・籠」の3字については、これまでの常用漢字と同じ構成要素の字体を、やはり許容字体として併記することを要望します。その上で、「

  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
    xiaodong
    xiaodong 2009/12/13
    安岡先生「図4●新しい常用漢字表と文字コードの関係」がわかりやすい。