タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

encodeに関するogawastのブックマーク (2)

  • マルチバイトサポート

    マルチバイト(MB)サポートは、 PostgresでEUC (Extended Unix Code)や Unicode、Mule内部コードなどのマルチバイト文字集合を扱えるようにしているものです。 MBを使用することによって、正規表現(regexp)や LIKE、いくつかの関数でマルチバイト文字を使用できるようになります。 initdbを使ってPostgresを 初期化する際に、ディフォルトのエンコーディングシステムが設定されます。また、 この設定は、SQLコマンド、CREATE DATABASEcreatedbで データベースを作成する際に変更することができます。したがって、 データベース毎に異ったマルチバイトのエンコーディングシステムを使用することが できます。 また、MBは、ISO8859を含む8ビットのシングルバイト文字セットに ある問題の一部を修正します。(すべての問題を解決す

    ogawast
    ogawast 2007/01/18
    postgresでの対処法
  • Python でUTF-8, shift_jis, euc_jpなど日本語を使う方法

    [Home] [Setting up Mac OS X] [Python]: [ファイルを読む] 日語を使う Pythonで日語を使う Python 2.4以降では、標準で日語を扱うことができます。 PythonのソースコードをUTF-8で書くには 日語を扱うPythonのスクリプトの中では、UTF-8の文字コードを使うのが 楽です。 Mac OS Xのターミナルで日語を扱う場合は、 ここの「4. Terminalの設定を変える」の 指示に従ってください。 以下、ソースコードの簡単な例を示します。 #!/usr/bin/env python # -*- coding: utf-8 -*- import re jtext = u'子が隠れんぼをしています' print 'jtext has', len(jtext), 'Japanese characters.' if re.se

  • 1