タグ

ITとiconvに関するyanokのブックマーク (4)

  • libiconv に JIS X 0213がない場合 - yanok.net

    GNU libiconvはJIS X 0213の符号化方式、Shift_JIS-2004 (Shift_JISX0213) や EUC-JIS-2004 (EUC-JISX0213) に対応していますが、コマンドを実行した際にこれらが入っていない場合もあり得ます。入っているかどうかはiconvのコマンドラインオプション --list で確かめられます。 これらの符号化方式に対応するには、ビルドする際にconfigureのオプション --enable-extra-encodings を指定しておく必要があるようです。インストールされているiconvコマンドでShift_JIS-2004が使えないときはこれが指定されていなかった可能性があります。もしこれらの符号化方式が入ってなかったら、管理者に相談するか、そうでなければ、自分でソースをダウンロードして上記のオプションを用いてビルドしてみるのも

    yanok
    yanok 2017/03/20
    「ビルドする際にconfigureのオプション --enable-extra-encodings を指定」
  • iconv、Java、PythonのJISX0213: yuan-jiu blog

    JISX0201とJISX0213を併用したデータをShift_JIS-2004で符号化し、iconv、JavaPythonUTF-8に変換した結果を比較してみた。 (原則としてJISX0213はそれ自身で完結した文字集合でありJISX0208のようにJISX0201と併用するものではないが、JISX0213に移行する際にはJISX0201とJISX0208を併用した既存のデータをShit_JIS-2004として扱いたい場合もありえるので、試してみた。) 各々のバージョンとエンコーディング名は次のとおり。 iconv (Debian EGLIBC 2.11.3-4) 2.11.3 --from-code=SHIFT_JISX0213 java version "1.7.0_21" Charset-name "x-SJIS_0213" Python version 3.3.1 encod

    yanok
    yanok 2016/12/04
    「Shift_JIS-2004で符号化し、iconv、Java、PythonでUTF-8に変換した結果を比較」
  • HP-UX 11i v3のJIS X 0213:2004 - kkamegawa's weblog

    302 Moved Temporarilyより なんで私が?と思うかもしれませんけれど、お仕事でちょっぴり使う可能性があるので無関心ではいられません。11iv3でJIS X 0213:2004対応されたのですが、重要なのはこのへん。 HP-UX では JIS X 0213 の符号化表現として Unicode/ISO10646 を採用し、ja_JP.utf8 ロケールでサポートしています。 ふむふむ。 入力 JIS X 0213 の漢字集合符号表、漢字音訓索引表、および漢字部首・画数索引表が /usr/lib/asx/tbl/jisx0213 ディレクトリにあります。JIS X 0213 で拡張された第 3 水準、第 4 水準の文字を入力する場合はこれらのファイルを参照して、カット・ペースト機能で入力してください。ATOK X および HP XJIM では拡張部分の文字入力はサポートされてい

    HP-UX 11i v3のJIS X 0213:2004 - kkamegawa's weblog
    yanok
    yanok 2016/11/20
    「Shift_JIS-2004, EUC-JIS-2004 はそれぞれ sjis2004, eucJP2004 というコードセット名で登録」
  • Cygwin の iconv で EUC-JIS-2004 や Shift_JIS-2004 - yanok.net

    yanok
    yanok 2016/10/23
    「Cygwinで iconv --list してみたら、SHIFT_JIS-2004 や EUC-JIS-2004 が、それぞれ SHIFT_JISX0213, EUC-JISX0213のエイリアスとして登録されている」
  • 1