タグ

Pythonと文字列に関するeibiisii_mikanのブックマーク (6)

  • Pythonで日本語文字列 (UnicodeとUTF-8, Shift-JIS, EUC-JPなどの相互変換) - プログラミング工場 / Python

    2010年05月05日 22:37 カテゴリPython Pythonで日語文字列 (UnicodeとUTF-8, Shift-JIS, EUC-JPなどの相互変換) Posted by yawamen No Trackbacks Tweet ※2.*系の話です.3.*系は違うので注意. Pythonで日語を扱う場合,UTF-8やShift-JIS, EUC-JPなどの各種文字コードが使えますが, これらとは別にPythonにはUnicode文字列というものが存在します. ※PythonではUTF-8とUnicodeは別物です. 詳しくはマニュアルを読んで頂くとして,ここではソースコードの書き方やいろいろな変換について紹介します. 【ソースコード中に日語を書くために】 まず最初に,基的なこととして,何も考えずにソースコード中に日語文字を書いてしまうと次のようなエラーが出る場合があ

  • 3.6.1 文字列メソッド

    codec に登録された文字コード系 encoding を使って文字列をデコード します。encoding は標準でデフォルトの文字列エンコーディング になります。標準とは異なるエラー処理を行うために errors を 与えることができます。標準のエラー処理は 'strict' で、エンコード に関するエラーは UnicodeError を送出します。 他に利用できる値は 'ignore' 、 'replace' および 関数 codecs.register_error によって登録された名前です。 これについてはセクション 4.8.1節を参照してください。 バージョン 2.2 で 新たに追加 された仕様です。 バージョン 2.3 で 変更 された仕様: その他のエラーハンドリングスキーマがサポートされました

  • Python で文字列中の変数をフォーマットして置き換える

    1. %演算子 2.3.6.2 文字列フォーマット操作 によると、 文字列および Unicode オブジェクトには固有の操作: % 演算子 (モジュロ) があります。(…) format % values (format は文字列または Unicode オブジェクト)とすると、format 中の % 変換指定は values 中のゼロ個またはそれ以上の要素で置換されます。 うーむ、%演算子という独自のものがあるのか。(@_@;) 2. 数値で置き換える 文字列の中の変数が一つの場合、 a = 100 b = -200 print "Hello! %d" % a 結果、 Hello! 100 タプル、マップオブジェクト 文字列の中に変数が二つ以上ある場合、タプル、マップオブジェクトを使う。 # タプル print "Hello! %d %d" % (a, b) # マップオブジェクト pri

    eibiisii_mikan
    eibiisii_mikan 2010/10/05
    [%演算子]
  • 文字列の操作 - ひきメモ

    文字列のメソッドは正規表現を使うより速いので、文字列の操作をする場合は、まず文字列のメソッドでできないかを調べた方がよいです。 文字列の一部を取り出す >>> s = "python" >>> s[2] # 2番目の要素を取り出す 't' >>> s[1:4] # 1番目から3番目までの文字を取り出す 'yth' >>> print s[2:] # 2番目から末尾までの文字を取り出す そん >>> s[0] = "P" # 文字列は不変なので、要素への代入は不可 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'str' object does not support item assignment 文字列が○○だけであるかを調べる >>> "abcABC123".isaln

    文字列の操作 - ひきメモ
    eibiisii_mikan
    eibiisii_mikan 2010/10/05
    Pythonの文字列操作べんり…!!
  • 3.6.2 文字列フォーマット操作

    文字列および Unicode オブジェクトには固有の操作: % 演算子 (モジュロ) があります。この演算子は文字列 フォーマット化 または 補間 演算としても知られています。 format % values (format は文字列または Unicode オブジェクト)とすると、format 中の % 変換指定は values 中のゼロ個またはそれ以上の要素で置換されます。 この動作は C 言語における sprintf() に似ています。 format が Unicode オブジェクトであるか、または %s 変換を使って Unicode オブジェクトが変換される場合、その結果も Unicode オブジェクトになります。 format が単一の引数しか要求しない場合、values は タプルでない単一のオブジェクトでもかまいません。 3.4それ以外の場合、values はフォーマット文字列

  • いやなブログ - 文字列操作の比較表: Ruby, Python, JavaScript, P...

    文字列操作の比較表: Ruby, Python, JavaScript, Perl, C++ Ruby, Python, JavaScript, Perl, C++ の文字列操作の比較表を作りました。配列操作の比較表の続編です。間違いなどがあったらご指摘いただけると助かります。 Ruby (String) Python (str) JavaScript (String) Perl C++ (std::string)

  • 1