タグ

ブックマーク / yanok.net (2)

  • ATOK 用 JIS 第3・第4水準辞書 公開 - yanok.net

    Anthyに続き、ATOK用にも、JIS第3・第4水準の辞書を作成し、このたび公開しました。下記のリンクからどうぞ。 ATOK用JIS第3・第4水準漢字変換辞書 10年にわたって保守・開発されている、SKK用のJIS X 0213対応辞書SKK-JISYO.JIS3_4とSKK-JISYO.JIS2004を元に作成したものです。 これで、ATOKでも、魹ヶ崎 (とどがさき、岩手県宮古市)、𣖔木作 (ほうのきざく、福島県いわき市)、𩸕網代 (きびなごあじろ、長崎県五島列島)、吐噶喇列島といった地名や、三国志の登場人物の龐統や許褚、邢道栄、賈詡、譙周、などなど、書家の米芾 (べいふつ)、褚遂良 (ちょすいりょう) といった人名、火星の意味の熒惑 (けいこく)、世界史の授業で習った璦琿(あいぐん)条約、菩薩の意味の菩提薩埵、美少女を意味する蜾蠃少女(すがるおとめ)、などなど、様々な漢字が変換

  • シフトJISが符号化文字集合? - yanok.net

    文字コードに関して、符号化文字集合と文字符号化方式という区別がいわれることがあります。拙著『プログラマのための文字コード技術入門』でもその分類に従っています。 この区分によると、JIS X 0208やJIS X 0213は符号化文字集合で、シフトJISは文字符号化方式だということになります。 ところが、混乱させることをいうようですが、JIS X 0208:1997では、シフトJISは符号化文字集合だと書かれています。ウソだと思うなら、JIS X 0208:1997の附属書1を見てみると良いでしょう。 これはどういうことでしょう。シフトJISが文字符号化方式だというのが間違っているのでしょうか、それとも97JISの記述が間違っているのでしょうか? 結論をいってしまうと、これは単に用語法の問題ということになります。 そもそも、「符号化文字集合と文字符号化方式」という区分はISOやJISといった

  • 1