タグ

文字コードに関するnaoeのブックマーク (3)

  • PythonのUnicodeEncodeErrorを知る - HDEラボ

    Pythonにはじめて触って、いつのまにか1年が過ぎたのですが、一番はまったのは、やっぱりunicodeの扱いだったと思います。 特に、 UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-12: ordinal not in range(128) のようなエラーにはさんざん悩まされました。ここがたとえばrubyなど他の言語と比べてわかりにくいために、Pythonが取っつきにくい言語になっているのではないか、と個人的には思います。 そこで、このエラーに関係するはまりどころとTipsをいくつか列挙してみました。これからPythonに触れられる方の参考になればと思います。 なお、環境はUNIX上のPython 2.4, 2.5を想定しています。 u1はunicode型で、s1はstr型です。s1にどのよ

  • 全角片仮名と全角平仮名の変換をした際に悩んだこと

    ひらがなとカタカナをプログラムで相互に変換しようとした時に、何かと悩むことが多かったので悩ましかった点をまとめてみた。 結局、どう変換するのが良いものやら分からぬまま中途半端に調査終了。はてさて、どうしたものか。 あと文字コード表は、unicode.org と charset.7jp.netを参照しました。 「ぁ~ん」を変換するのは楽だけど、Shift_JISは少し注意(文字コードはどこまで対応しよう) 最大の悩みどころは、 「ヴ」をどうするか 「ゝ」「ヽ」あたりは変換しようか 小文字の 「ヵ」と 「ヶ」はどうしたものか ワ行に濁点が付いた文字は分解して変換すべきか 「より」と「コト」を意味するあの文字は、「ヨリ」と「こと」に変換した方がいいだろうか

  • 二代目俺のメモ | ただのメモ

    Squid でプロキシを立てたのでメモ まずは apt でインストール。 インストールが終わったら /etc/squid/squid.conf ファイルをバックアップしておく。 /etc/squid/squ […] 続きを読む

  • 1