G0: ASCII G1: JIS X 0213:2000 第一面 G2: JIS X 0201カナ G3: JIS X 0213:2000 第二面 + JIS X 0212 なお、G2に関してはEUC-JPとの互換性のためにあり、原則として使わないことになっている。 従来のEUC-JPでは、G0にJIS X 0208が、G3に補助漢字(JIS X 0212)がそれぞれ指示されていた。JIS X 0213は、これらの文字と衝突しないように文字位置を定義しているため、共存することができる。 但し、JIS X 0213自体は、特にJIS X 0212との同時利用は前提としていない(同じ文字がJIS X 0213とJIS X 0212に存在するため)が、既存のEUC-JP対応ソフトウェアは、殆ど何も変更しなくてもEUC-JISX0213が扱える可能性が高い。
アプリケーションのバージョンアップなどでテーブル追加を伴うスキーマ変更があった場合に、テーブル追加したところのデータだけ画面で「????」になって表示されてしまうことが稀にあります。 この対応方法について、発生理由と共に簡単に解説しておこうと思います。 結果だけを先に書いておくと、今回の根本原因はAmazonRDSを起動するときのパラメータグループの初期設定が不十分で、初回create database時に default character set に想定外のものがセットされていたためです。 下記ではその原因を特定する方法と解決方法を示していきます。 まずは文字化けした時に状況確認を行ってみてください。おそらくは下記のような状況になっているかと思います。※今回は文字コードを全てutf8に統一しているものとします。 まずは文字化けしているテーブルの情報を確認してみます。 mysql> sh
utf8とutf-8どっちだっけ?とかよく忘れるのでメモ fencはfileencoding、encはencoding 文字コードを変更 (:wしないと変更が保存されない) :set fenc=utf-8 :set fenc=euc-jp :set fenc=iso-2022-jp :set fenc=cp932 ※cp932はshift-jisのこと 違う文字コードでファイルを開き直す(文字化けの時に) :e ++enc=utf-8 :e ++enc=euc-jp :e ++enc=iso-2022-jp :e ++enc=cp932 参考 http://www.kawaz.jp/pukiwiki/?vim#s91b6126
* LFはNL、FFはNPと呼ばれることもある。 * 赤字は制御文字、SPは空白文字(スペース)、黒字と緑字は図形文字。 * 緑字はISO 646で文字の変更が認められ、日本ではバックスラッシュが円記号になっている。
ユニコードにはいくつかの種類があり、最もよく使用されるのがUTF-8とUTF-16です。 UTF-8の日本語で使用されるものは、半角文字は1バイト、全角文字は3バイト(一部2バイト)で表されます。 UTF-16の日本語で使用されるものは、半角文字も全角文字も2バイトで表されます。 UTF-8は、全角文字が3バイトで表記されるため、他のコードで記載したファイルに比べ、容量が大きくなります。 このページにある全角文字は、21420文字です。 Unicodeは漢字を画数の少ない『一』から、画数順になっているのに対し、 それ以外の文字コードは50音順の『亜』から始まっています。 UTC(Unicode Technical Committee)の定義したUnicode文字のブロックの範囲は以下です。 しかし漢字の中には『F9xx』『FAxx』のものもわずかにあります。 文字の種類ブロックの範囲(16
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く