タグ

codeに関するmid_knightのブックマーク (10)

  • VistaをXPの字体に戻すというjp90タグの罠

    JIS C 6226が最初に制定されたのは1978年。6802字を収録した漢字コードとして制定され,規格票の例示字体は写研の石井明朝体で印刷された。ところがJIS C 6226は,1983年に改正された際,漢字300字の字体を変更した。この改正で「同じ文字コードでも違う字が表示されてしまう」という現象が頻繁に起こった。いわゆる「83JIS改正の悪夢」だ。 さらにJIS C 6226は,1987年にJIS X 0208という名前に変わっているが,このときには規格そのものの変更は一切おこなわれていない。次の1990年の改正では,規格票例示字体を平成明朝体に変えたので,1983年版とは微妙に字体が変わってしまった。これに懲りて,1997年の改正では,規格票例示字体は一切いじることなく,字数も全く変更せず,あくまで規格そのものの明確化につとめた。 一方,1990年にはJIS X 0212(補助漢字

    VistaをXPの字体に戻すというjp90タグの罠
    mid_knight
    mid_knight 2007/02/20
    「VistaはJIS90も扱える」という噂は噓
  • 安岡孝一の日記: JIS X 0213:2004のエンコーディングメソッド

    山口哲弘の『複数の事象を混同しがちなVistaの文字問題』(日経ITPro, 2006年12月15日)の以下の部分が、どうも気になって仕方ないので、あえてツッコミを入れておこうと思う。 実際には,JIS2004で扱えるJIS第3/第4水準の文字についてもキャラクタ・コードを割り振った「シフトJIS2004」や「EUC2004」などのエンコーディングがある。ただしこれらは「標準(Standard)」ではない。 どうやら、この山口哲弘なる記者は、JIS X 0213の規格票に全く目を通していないようだ。規格票を読めばわかることだが、JIS X 0213:2004の実装水準4には、全部で9つのエンコーディングメソッドが存在する。9つのエンコーディングメソッドのうち、「漢字用7ビット符号」「漢字用8ビット符号」「国際基準版・漢字用7ビット符号」「国際基準版・漢字用8ビット符号」「ラテン文字・漢字用

    mid_knight
    mid_knight 2007/01/31
    EUC-JIS-2004は「半角カナ」を除けばJIS X 0213:2004の本体に規定されてる
  • JIS X 0212-1990とJIS X 0213:2004 | yasuokaの日記 | スラド

    とあったので、さすがにギョッとなった。そんなこと、私、語ってないぞ。『JIS X 0212とJIS X 0213』(京都大学大型計算機センター第64回研究セミナー報告, 2000年3月24日, pp.19-46)にも書いたとおり、JIS X 0212-1990の文字のうち3144字程度はJIS X 0213:2000に含まれていない。ここで「程度」と書いたのにはわけがあって、「嶲」「殩」「瓯」「籩」「鳦」などのように、JIS X 0212とJIS X 0213で包摂関係がないにもかかわらず、Unicodeが共有されているというヤヤコシイ字があるからだ。さらには、JIS X 0213:2000とJIS X 0213:2004との間で追加された10字のうち、「瘦」と「繫」の2字がJIS X 0212に含まれているが、「瘦」の方はJIS X 0212と微妙に字体が違う、というヤヤコシサだ。こうい

    mid_knight
    mid_knight 2007/01/31
    「0213には0212の一部が含まれる」という点については修正されたみたい
  • VistaでUnicode以外の選択肢はなかったのか?──京大の安岡助教授が語る

    「『JIS X 0213』の基的な考えは,必要な漢字を使いたくても使えなくて困っている人たちを助けることだった」。こう語るのは,京都大学人文科学研究所附属漢字情報研究センター助教授の安岡孝一氏。1997年以来JISの委員としてJIS規格の文字コード(「JIS X 0213」や「JIS X 0213:2004」など)の策定にかかわってきた安岡氏に,最近の文字コードの変遷や,Windows VistaにおけるJIS X 0213対応に関する見解を聞いた。 ──JIS X 0213の概要や,それが2004年に改訂された経緯などを教えてほしい。 安岡氏:過去に使われていた文字集合「JIS X 0208」や「JIS X 0212」には,日の地名で使われている文字が抜けているなど,重要な文字の不足がありました。ただしこの問題は,そこに住む地元の人は困っていても,日全体で見るとほとんどの人が困って

    VistaでUnicode以外の選択肢はなかったのか?──京大の安岡助教授が語る
    mid_knight
    mid_knight 2006/12/28
    VistaにおけるマイクロソフトのJIS X 0213サポートは「文字コード」のサポートではない。サポートするなら徹底してサポートして欲しい。
  • 春のあらしです!

    僕は東京の江戸川区に住んでいますが、外はすごい風。 まるで台風上陸時のようです。(おおげさではありません) 気象庁のアメダスの観測データをみてみたら、 17日午前2時現在、新木場では14㍍の強風になっています。 午前1時には7㍍でしたから、急に2倍の強風になったことになります。 推測ですが、最大瞬間では30㍍を超えているような 突風が吹いています。まさに台風並みです。 16日の朝は日差しもあったくらいで、わずか24時間で天気は急変しました。 さて、17日2時現在、まだ南南西の風ですので、低気圧は 通りすぎていませんが、あと数時間もすれば、低気圧は関東の東へ抜けて、 東京の風は北よりに変わるでしょう。 ただ、吹き返しの北風も台風並みに非常に風が強いかも知れません。 これも春の天気の特徴です。

    mid_knight
    mid_knight 2006/03/17
    よめない
  • 子供、いらない:[电影]触不到的恋人

    【中文名】触不到的恋人 【原文名】時越愛 【英文名】IL MARE 【日文名】イルマーレ 【导演】 李胜(イ・ヒョンスン) 【演员】 全智贤(チョン・ジヒョン) 李政宰(イ・ジョンジェ) 【类别】 电影 爱情 韩国影剧 The Perfect Collection イルマーレ DZ-144 簡体字なら、直接文欄に入力しても大丈夫? # EUC-JPとGB2312の混在は可能ってことか? でも、タイトルは駄目みたい。 # 「[电影]触不到的恋人」って書いたつもり イル・マーレ (IL MARE) 2006年02月13日01:49

    mid_knight
    mid_knight 2006/02/24
    GB2312な文字(例えば电影)を含む記事の場合
  • 安岡孝一(インターネット・文字の歴史など)

    安岡孝一の Universal DependenciesとBERT/RoBERTa/DeBERTaモデルによる多言語情報処理 京都大学人文科学研究所・未踏科学研究ユニット・データサイエンスで切り拓く総合地域研究ユニット (2024年2月). 住民基台帳ネットワーク漢字辞典 京都大学未踏科学研究ユニット・学知創生ユニット・人文科学研究所 (2019年1月). 日中国台湾・香港・韓国の常用漢字と漢字コード 京都大学未踏科学研究ユニット・学知創生ユニット・人文科学研究所 (2017年3月). [京都大学リポジトリ] 新しい常用漢字と人名用漢字 三省堂 (2011年3月), ISBN978-4-385-36523-7. 新常用漢字表の文字論 勉誠出版 (2009年12月), ISBN978-4-585-03227-4. [訂正] 石刻千字文 京都大学21世紀COE (2008年3月).

  • SJISはあまり使わないようがよいかも

    エレクトロニック・サービス・イニシアチブのWebシステムのコンサルタントのブログです。Webシステムを対象としたセキュアコーディング/セキュアプログラミング、SAMM、ソースコード検査、Webシステム開発、パフォーマンスチューニングの技術支援、コンサルティング、セミナー開催、書籍などの執筆、PROVE for PHPの開発、PHP4.x/5.xレガシーPHPセキュリティパッチサービスなどを行っています。 ブログのサブタイトルを「書かない日記」としているのは、ブログを始めた時にあまり書かないつもりで始めたのでこのサブタイトルになっています。 氏名:大垣 靖男 私が記述したブログ中のコードは記載が無い場合はMITライセンスです。その他のコードは参考リンクなどのライセンス情報を参照ください。 ご依頼・ご相談は info@es-i.jp まで。

    SJISはあまり使わないようがよいかも
    mid_knight
    mid_knight 2006/02/16
    SJISの最大のデメリットは、2バイト目に\(0x5C)があることだろう、「表」とか「ソ」とか。同じシフトコードならEUC-JPやUTF-8が良い
  • はてな アメリカに住んでいるのですが、「÷」マークを見たことがありません。(1)そもそも、このマークはなんと言うのですか。(2)「÷」マークの由来を教えて・・

    アメリカに住んでいるのですが、「÷」マークを見たことがありません。 (1)そもそも、このマークはなんと言うのですか。 (2)「÷」マークの由来を教えてください。 (3)日以外でも使われているのでしょうか。

    mid_knight
    mid_knight 2006/02/14
    Latin1にも×(×)とか÷(÷)とかあるけど
  • 1