UTF-8 の文字にマッチする正規表現 2006-03-09-1 [Programming] UTF-8の文字にマッチする正規表現の素直版。 レガシーなのに対応するとき用にメモ。 [\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}|[\xF0-\xF7] [\x80-\xBF]{3}|[\xF8-\xFB][\x80-\xBF]{4}|[\xFC-\xFD][\x80-\xBF]{5} 1 2 3 4 5 60xxxxxxx 110xxxxx10xxxxxx 1110xxxx10xxxxxx10xxxxxx 11110xxx10xxxxxx10xxxxxx10xxxxxx 111110xx10xxxxxx10xxxxxx10xxxxxx10xxxxxx 1111110x10xxxxxx10xxxxxx10xxxxx
最近は、UTF-8文字エンコードしたファイルを利用することが多くなりました。GnomeなどのGUI環境を利用している場合は、UTF-8対応のエディタが標準で備わっているため問題ないですが、コンソール環境などでは、必ずしもLinuxで快適に利用できる環境が最初から揃っているとは限りません。 そこで、UTF-8文字エンコードされているファイルを扱う環境を作成していきます。 'cat'や'less'コマンドを皆さん利用されているでしょう。しかし、'cat'や'less'ではUTF8エンコードされたファイルを正しく表示できません。UTF-8ファイルを利用する場合は、これに変わるコマンドとして、'lv'コマンドを利用しましょう。 Debianでは、"apt-get install lv"で利用できるようになります。 例) %lv [FileName]
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く