タグ

itとeucに関するyanokのブックマーク (3)

  • libiconv に JIS X 0213がない場合 - yanok.net

    GNU libiconvはJIS X 0213の符号化方式、Shift_JIS-2004 (Shift_JISX0213) や EUC-JIS-2004 (EUC-JISX0213) に対応していますが、コマンドを実行した際にこれらが入っていない場合もあり得ます。入っているかどうかはiconvのコマンドラインオプション --list で確かめられます。 これらの符号化方式に対応するには、ビルドする際にconfigureのオプション --enable-extra-encodings を指定しておく必要があるようです。インストールされているiconvコマンドでShift_JIS-2004が使えないときはこれが指定されていなかった可能性があります。もしこれらの符号化方式が入ってなかったら、管理者に相談するか、そうでなければ、自分でソースをダウンロードして上記のオプションを用いてビルドしてみるのも

    yanok
    yanok 2017/03/20
    「ビルドする際にconfigureのオプション --enable-extra-encodings を指定」
  • EUCが国際標準化されていれば良かった - yanok.net

    すごい後知恵なんですが、1980年代に「EUC」方式の文字コードをISOで国際標準化しておけば良かったのではと考えます。 EUC方式、というのがどういうことかというと、 8ビット符号表のGL領域(0x20-0x7F)にASCIIを配置、 GR領域には2バイトの漢字コードを配置 という形が基で、必要に応じてシングルシフトコードでG2, G3に指示されている2バイト(ないし1バイト)符号化文字集合をGRに呼び出せるステートレスな符号、というものです。 具体的には、EUC-JIS-2004, EUC-JP, EUC-KR, EUC-CNなどです。 これはISO/IEC 2022の枠内の運用なので、別段この方式を改めて標準化する必要はないのではないか、という意見もあるでしょう。しかし、型決めしておくことによるメリットもあります。理解が容易になり、設計や実装も使い回せる。特に2022は複雑ですから

    yanok
    yanok 2016/11/19
    「1980年代に「EUC」方式の文字コードをISOで国際標準化しておけば良かったのでは」
  • EUC-JIS-2004 - JIS X 0213 Wiki

    yanok
    yanok 2016/10/16
    「EUC-JIS-2004は、JIS X 0213の符号化方式のひとつであり、JIS X 0213とASCIIを同時に運用するものです」
  • 1