[B! python][utf-8] ishideoのブックマーク

ishideo id:ishideo

pythonとutf-8に関するishideoのブックマーク (15)

python3 中的编码问题：encode 和 decode
ishideo 2019/07/22
python

chinese

gbk

decode

encode

utf-8
リンク
Python2で文字列を処理する際の心掛け - Qiita
日本語を扱うPythonプログラマ(with Python2)にとっての最大の天敵(過言)、UnicodeEncodeError。昨日横の人がその餌食となり、その解決の手助けをしているうちに自分の中でPython2での文字列処理の方向が少し整理できた。(近いうちにPython3バージョンもまとめたい) 個人的結論バイト文字列/ユニコード文字列のどちらを扱っているかを常に意識しておく。 (基本的に)プログラム内ではユニコード文字列を扱い、標準入出力とやり取りする際(ex. print)にはバイト文字列に変換する。バイト文字列とユニコード文字列バイト文字列は特定のエンコード方式(ex. utf-8)でエンコードされており、リテラルでは'あいう'のように表現する。一方、ユニコード文字列はUnicodeのコードポイントを並べたものであり、リテラルではu'あいう'のようにuをつける。 (py
ishideo 2016/07/29
python

decode

encode

utf-8

python2
リンク
python2.6でdictionaryをjson化した際、日本語が\uXXXXにエスケープされないようにする CodingFirst
C言語、Perl、JavaScript、最近はPythonも。出来上がったものより、プログラムを書くことが好き。あと、スイーツ。 Python2.6でdictionaryをjson文字列化したときに日本語が\uXXXXとUTF-16な文字列にエスケープさせないようにするのに苦労した。 (忙しい人は、最後の要するに～の部分をご参考に) Pythonでdictionaryをファイルに読み書きするとき、テキストファイルで一番簡単なのはJSON文字列化する手だろう。テキストにすると、エディタで編集できるし、diffもとりやすいし、gitやsvn管理した際に履歴も追いやすい。だけど、JSON文字列化がむずかしい。日本語が\\uXXXXとUTF-16な文字としてエスケープされてしまう。これだと日本語部分をエディタで編集できなくなってしまうので、いろいろ試してみた。まず、dictiona
ishideo 2016/07/25
dictonary

python

json

dump

codec

ascii

2.7

utf-8
リンク
Cheat Sheet: Writing Python 2-3 compatible code — Python-Future documentation
Cheat Sheet: Writing Python 2-3 compatible code¶ Copyright (c): 2013-2024 Python Charmers, Australia. Author: Ed Schofield. Licence: Creative Commons Attribution. A PDF version is here: https://python-future.org/compatible_idioms.pdf This notebook shows you idioms for writing future-proof code that is compatible with both versions of Python: 2 and 3. It accompanies Ed Schofield’s talk at PyCon AU
ishideo 2016/06/17
pip

import

future

python

python2

python3

builtins

open

utf-8

__future__
リンク
Python のバージョン毎の違いとその吸収方法について - CUBE SUGAR CONTAINER
この記事の目指すところ現在 Python はバージョン 2.x 系と 3.x 系という、一部に互換性のないふたつのメジャーバージョンが併用されている。その上で、この記事にはふたつの目的がある。ひとつ目は、2.x 系と 3.x 系の違いについてまとめること。現状、それぞれのバージョン毎の違いはまとまっているところが少ない。自分用に、このページだけ見ればひと通り分かる！っていうものがほしかった。ふたつ目は、2.x 系と 3.x 系の違いを吸収するソースコードの書き方についてまとめること。こちらも Web 上にナレッジがあまりまとまっていない。これについては今 python-future というパッケージがアツい。尚、サポートするバージョンは以下の通り。 2.x 系: 2.6 と 2.7 3.x 系: 3.3 と 3.4 本題に入る前に、最近の Python 事情についてまとめ
ishideo 2016/06/17
pip

import

future

python

python2

python3

builtins

open

utf-8

__future__
リンク
Python スクリプト実行時に UnicodeDecodeError が出る場合の対処方法 - その後のその後
Xcode の Run Script 機能を使ってみようと思い、Github で拾ってきた Python スクリプトを実行しようとすると、下記のようなエラーが出て困りました。 UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position xx: ordinal not in range(128) 対処手順 1. 現状のデフォルトエンコーディングを確認 $ python >>> import sys >>> sys.getdefaultencoding() 'ascii'これが'ascii'となっているのがよくないようです。 2. site-packagesディレクトリの場所を探すまず、 pythonと打ったときにわらわらと出てくる文字列で自分の環境でのpythonのバージョンが確認できます。で、自分の場合は2.
ishideo 2016/06/13
UnicodeDecodeError

python

python2

utf-8

sys

site-packages

sitecustomize.py
リンク
Pythonでの日本語メールはUTF-8がベストかも - TechTalkManiacs
Study Mailの開発で日本語メールの問題にぶつかりましたので、その解決方法を公開します。結論としては、Pythonの場合はUTF-8でエンコードしてしまうのがベストのようです。 Dajngo　Em ailMessageで文字コードを指定するよく知られているように、日本語で書かれたメールを送信する場合はiso2022でエンコードするのが一般的です。二バイト文字のエンコードに問題の多いことで知られるPythonですが、幸いエンコードそのものについては部品として切り出して使えるwebアプリケーションフレームワークDjangoを利用することで問題なく行うことができます。 Djangoには電子メールのメッセージを表現するEm ailMessageクラスがあり、メールとしてのメッセージの組み立てを簡易化してくれます。文字コードについてもドキュメント化こそされていませんがソースを読むとencodin
ishideo 2012/06/15
python

Django

mail

utf-8

encoding
リンク
https://www.freia.jp/taka/blog/571
ishideo 2010/07/31
python

encoding

convert

utf-8
リンク
PythonのUnicodeEncodeErrorを知る - HDEラボ
Pythonにはじめて触って、いつのまにか1年が過ぎたのですが、一番はまったのは、やっぱりunicodeの扱いだったと思います。特に、 UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-12: ordinal not in range(128) のようなエラーにはさんざん悩まされました。ここがたとえばrubyなど他の言語と比べてわかりにくいために、Pythonが取っつきにくい言語になっているのではないか、と個人的には思います。そこで、このエラーに関係するはまりどころとTipsをいくつか列挙してみました。これからPythonに触れられる方の参考になればと思います。なお、環境はUNIX上のPython 2.4, 2.5を想定しています。 u1はunicode型で、s1はstr型です。s1にどのよ
ishideo 2009/05/22
encoding

python

utf-8

unicode

UnicodeEncodeError
リンク
Python でUTF-8, shift_jis, euc_jpなど日本語を使う方法
[Home] [Setting up Mac OS X] [Python]: [ファイルを読む] 日本語を使う Pythonで日本語を使う Python 2.4以降では、標準で日本語を扱うことができます。 PythonのソースコードをUTF-8で書くには日本語を扱うPythonのスクリプトの中では、UTF-8の文字コードを使うのが楽です。 Mac OS Xのターミナルで日本語を扱う場合は、ここの「4. Terminalの設定を変える」の指示に従ってください。以下、ソースコードの簡単な例を示します。 #!/usr/bin/env python # -*- coding: utf-8 -*- import re jtext = u'子猫が隠れんぼをしています' print 'jtext has', len(jtext), 'Japanese characters.' if re.se
ishideo 2008/08/06
python

codecs

japanese

encode

utf-8

parser
リンク
pythonでHTML解析 - 清水川Web
ishideo 2008/08/06
python

shift_jis-2004

mbcs

ppkd

auto

encode

utf-8

parser

guess
リンク
BlogSlime – Just another WordPress site
コンテンツへスキップ登録は無効化されました。
ishideo 2008/08/06
python

shift_jis-2004

mbcs

ppkd

auto

encode

utf-8
リンク
BlogSlime – Just another WordPress site
コンテンツへスキップ登録は無効化されました。
ishideo 2008/08/06
encoding

python

utf-8

tips
リンク
sh1.2 pyblosxom : PythonとCLISPの対応、及びCLISPの文字コードの話
Pythonですら、日本語ドキュメントが少ないと言われているけれども、 CLISPでは、それをはるかに上回って(下回って)日本語のドキュメントがないので、実現したい機能に対応する関数を見つけるのに非常に苦労します。新山さんによって訳された、 Lisp プログラマのための Python 人門は、本文にも書かれているように、PythonプログラマがLispを学ぶのにも良いのですが、ここに書かれている以外で見つけた関数をメモとしてPythonとの対比で書いておきます。ちょっとだけですが。 python clisp
ishideo 2007/03/22
clisp

python

utf-8

encoding
リンク
Life with Cygwin
沖ソフトウェア株式会社は、沖通信システム株式会社および株式会社沖インフォテックと平成22年10月1日をもって合併いたしました。新会社名は、株式会社OKIソフトウェアとなります。3社が行っております事業は新会社にて従来通り継続いたします。
ishideo 2006/06/06
python
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx