タグ

variable-width-encodingに関するnabinnoのブックマーク (2)

  • nkf - コマンド (プログラム) の説明 - Linux コマンド集 一覧表

    nkf [-butjnesliohrTVvwWJESZxXFfmMBOcdILg] [file ...] nkf はネットワークでメールやニュースの読み書きをするために作られた、漢字コードの変換フィルタである。 このnkf の特徴としては、入力漢字コード系の統計的な自動認識機能がある。 このため、利用者は、入力漢字コード系が何であるかを知らなくても、出力漢字コード系のみ指定すれば良いことになる。 ただ、この判定機構は、理論的には完全ではないが、通常のニュースやメールのメッセージについては確実に動作する安全なものにはなっている。 現在、nkf が認識できる入力の漢字コード系は、いわゆる JIS コード (ISO-2022-JP に基づくもの)、Shift_JIS (MS 漢字コード)、 日語 EUC (AT&T コード)、UTF-8、UTF-16 のいずれかである。 出力する漢字コード系も

  • マルチバイト文字 - Wikipedia

    この記事には複数の問題があります。 改善やノートページでの議論にご協力ください。 出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。(2019年7月) 独自研究が含まれているおそれがあります。(2019年7月) 正確性に疑問が呈されています。(2019年7月) 出典検索?: "マルチバイト文字" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL マルチバイト文字(マルチバイトもじ)とは、コンピュータ上で 1文字を複数バイトで表す体系(文字コード) 1文字のバイト数が可変であるような体系 そのような体系で表される文字 を指すが、文脈により意味合いが異なる。 ISO 2022の体系を前提とした図形文字集合において、1文字が1バイトの文字集合(英: single-byte char

  • 1