タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

toreadとencodingに関するclouderのブックマーク (2)

  • Encode 日本語などのマルチバイト文字列を適切に処理する - Perl入門〜サンプルコードによるPerl入門〜

    Perl › モジュール › here 日語などのマルチバイト文字をPerlで適切に扱うにはEncodeモジュールを使用します。次の3つのことを覚えておけば多くの場合適切に日語を扱うことができます。 外部から入力された文字列はEncodeモジュールのdecode関数でデコードする 外部へ出力する文字列はEncodeモジュールのencode関数でエンコードする ソースコードはUTF-8で保存しutf8プラグマを有効にする この解説での用語 この解説では外部から入力された文字列のことを「バイト文字列」と呼ぶことにします。Perlの内部表現に変換された文字列を「内部文字列」と呼ぶことにします。また「バイト文字列」が特定の文字コードで記述されている場合は「UTF-8バイト文字列」「Shift_JISバイト文字列」などと呼ぶことにします。 プログラミングで日語を扱う場合にその文字列がバイト文字

    Encode 日本語などのマルチバイト文字列を適切に処理する - Perl入門〜サンプルコードによるPerl入門〜
  • wakaponさんの超☆Perl備忘帳: utf8フラグについて

    microperlでutf8フラグがperlと同じ扱いうけてるのかを調べつつ,Perlにおけるunicode対応についてうわべだけをまとめてみるてst.とりあえずuse utf8とutf8::decode/encodeから切り込んでみた.文中ではutf8からはいふんぬきぬきしてます.表記としてutf-8が正しいです.たぶん.なお,今回の内容は変数の値に対するめもりんぐで,サブルーチン名や変数名に対する効果については触れないです.プラグマモジュールutf8プラグマモジュールutf8を使うと,ランタイムコンパイラのlexerに入力されるプログラムにある文字列定数の中に,文字コードがマルチバイトで構成される文字が入っていた場合,その文字列に対し,utf8フラグが付加される.5.10.0の実装では,struct svのflagsのSvUTF8ビットが立つ.プログラマはutf8フラグによって,マ

  • 1