タグ

japaneseに関するbubunpaのブックマーク (1)

  • kh.log - Pythonで全角半角を正規化する方法

    « 2008.03.06のdel.icio.us Main 第137回 TOEIC 申し込み失敗 » Pythonで全角半角を正規化する方法 | インターネット上の日語を扱っていると、全角半角が統一されていない事による表記揺れをなんとかしたい場面に出くわします。半角で書かれた iPod も、全角で書かれたiPodも同じものとして扱いたいときや、あるいは単に見た目がきれいになるように、英数字は半角に、カタカナは全角にそろえたい、という場合です。 Python では setomitsさんによる zenhan.py を使うと、文字種ごとに全角半角を選択して変換することができ、除外文字も設定できるので便利です。ただ、そこまで柔軟でなくても良く、単に表記揺れがなくなれば良い、という場合も多いかと思います。その場合はPythonの標準ライブラリに含まれる unicodedata モジュールの nor

  • 1