GNU libiconvはJIS X 0213の符号化方式、Shift_JIS-2004 (Shift_JISX0213) や EUC-JIS-2004 (EUC-JISX0213) に対応していますが、コマンドを実行した際にこれらが入っていない場合もあり得ます。入っているかどうかはiconvのコマンドラインオプション --list で確かめられます。 これらの符号化方式に対応するには、ビルドする際にconfigureのオプション --enable-extra-encodings を指定しておく必要があるようです。インストールされているiconvコマンドでShift_JIS-2004が使えないときはこれが指定されていなかった可能性があります。もしこれらの符号化方式が入ってなかったら、管理者に相談するか、そうでなければ、自分でソースをダウンロードして上記のオプションを用いてビルドしてみるのも
まとめました。 nkfとiconvの差異 https://nathancorvussolis.blogspot.jp/2015/05/difference-between-nkf-and-iconv.html Pythonとiconvの差異 https://nathancorvussolis.blogspot.jp/2016/11/difference-between-python-and-iconv.html JavaのShift_JIS-2004については下記のブログを引用させていただきました。 iconv、Java、PythonのJISX0213 - yuan-jiu blog http://yuan-jiu.asablo.jp/blog/2013/05/11/6807043 バージョン libiconv 1.14 nkf 2.1.4 Python 3.4.5 Java 1.7.0_
JISX0201とJISX0213を併用したデータをShift_JIS-2004で符号化し、iconv、Java、PythonでUTF-8に変換した結果を比較してみた。 (原則としてJISX0213はそれ自身で完結した文字集合でありJISX0208のようにJISX0201と併用するものではないが、JISX0213に移行する際にはJISX0201とJISX0208を併用した既存のデータをShit_JIS-2004として扱いたい場合もありえるので、試してみた。) 各々のバージョンとエンコーディング名は次のとおり。 iconv (Debian EGLIBC 2.11.3-4) 2.11.3 --from-code=SHIFT_JISX0213 java version "1.7.0_21" Charset-name "x-SJIS_0213" Python version 3.3.1 encod
302 Moved Temporarilyより なんで私が?と思うかもしれませんけれど、お仕事でちょっぴり使う可能性があるので無関心ではいられません。11iv3でJIS X 0213:2004対応されたのですが、重要なのはこのへん。 HP-UX では JIS X 0213 の符号化表現として Unicode/ISO10646 を採用し、ja_JP.utf8 ロケールでサポートしています。 ふむふむ。 入力 JIS X 0213 の漢字集合符号表、漢字音訓索引表、および漢字部首・画数索引表が /usr/lib/asx/tbl/jisx0213 ディレクトリにあります。JIS X 0213 で拡張された第 3 水準、第 4 水準の文字を入力する場合はこれらのファイルを参照して、カット・ペースト機能で入力してください。ATOK X および HP XJIM では拡張部分の文字入力はサポートされてい
すごい後知恵なんですが、1980年代に「EUC」方式の文字コードをISOで国際標準化しておけば良かったのではと考えます。 EUC方式、というのがどういうことかというと、 8ビット符号表のGL領域(0x20-0x7F)にASCIIを配置、 GR領域には2バイトの漢字コードを配置 という形が基本で、必要に応じてシングルシフトコードでG2, G3に指示されている2バイト(ないし1バイト)符号化文字集合をGRに呼び出せるステートレスな符号、というものです。 具体的には、EUC-JIS-2004, EUC-JP, EUC-KR, EUC-CNなどです。 これはISO/IEC 2022の枠内の運用なので、別段この方式を改めて標準化する必要はないのではないか、という意見もあるでしょう。しかし、型決めしておくことによるメリットもあります。理解が容易になり、設計や実装も使い回せる。特に2022は複雑ですから
JIS系文字コードとUnicodeとの変換によく使われるnkfとiconvの変換にどれくらい違いがあるのか調べてみました。 EUC-JIS-2004とShift_JIS-2004のファイルをそれぞれUTF-8に変換して、その結果を比較します。 nkf Network Kanji Filter http://sourceforge.jp/projects/nkf/ libiconv http://www.gnu.org/software/libiconv/ 変換元となるファイルについては、プロジェクトX0213の「JIS X 0213とUnicodeの対応表」から、文字付き版のファイルを使用しました。 JIS X 0213とUnicodeの対応表 http://x0213.org/codetable/ EUC-JIS-2004とUnicodeの対応表 文字付き版 http://x0213.o
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く