Pythonにはじめて触って、いつのまにか1年が過ぎたのですが、一番はまったのは、やっぱりunicodeの扱いだったと思います。 特に、 UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-12: ordinal not in range(128) のようなエラーにはさんざん悩まされました。ここがたとえばrubyなど他の言語と比べてわかりにくいために、Pythonが取っつきにくい言語になっているのではないか、と個人的には思います。 そこで、このエラーに関係するはまりどころとTipsをいくつか列挙してみました。これからPythonに触れられる方の参考になればと思います。 なお、環境はUNIX上のPython 2.4, 2.5を想定しています。 u1はunicode型で、s1はstr型です。s1にどのよ
Perl › Windows この方法では文字が正しく描画できないようです。(maeyanさんの記事)。 わたしの環境でも駄目でした。 手順 コマンドプロンプトのフォントの変更 コマンドプロンプトの文字コードの変更 ショートカットから文字コードの自動設定を行う。 Windowsのバージョン Windows XP Home Edition Version 2002 Service Pack 2 で行いました。 1. コマンドプロンプトのフォントの変更 コマンドプロンプトを立ち上げる→タイトルバー右クリック →プロパティ→フォントから"MS ゴシック"を選択する。 フォントを"MS ゴシック"に変更します。MS ゴシックは、Unicodeに対応するすべての文字を正しく表示できるわけではないですが、一応ユニコードに対応しています。日本語や飾り文字を含む文字を表示することができます。 2. コマン
Unicode 標準には、Basic Multilingual Plane (BMP) の文字と BMP の外部にある補助文字が含まれています。 このセクションでは、MySQL での Unicode のサポートについて説明します。 Unicode 規格自体の詳細は、「Unicode Consortium の web サイト」を参照してください。 BMP 文字には次の 3 つの特性があります。 コードポイント値は 0 から 65535 (または U+0000 と U+FFFF) の間です。 これらは、8、16 または 24 ビット (1 から 3 バイト) を使用して可変長エンコーディングでエンコードできます。 これらは、16 ビット (2 バイト) を使用して固定長エンコーディングでエンコードできます。 主要言語のほとんどすべての文字には、これらで十分です。
ディスク上のテーブルデータのストレージ要件は、複数の要因によって異なります。 別々のストレージエンジンは異なる方法でデータ型を表し、ローデータを格納します。 カラムか行全体のどちらかでテーブルデータを圧縮できますが、テーブルまたはカラムのストレージ要件の計算が複雑になります。 ディスク上のストレージレイアウトが違っていても、テーブル行に関する情報を通信および交換する内部 MySQL API は、すべてのストレージエンジンにわたって適用される一貫したデータ構造を使用します。 このセクションでは、データ型の固定サイズ表現を使用するストレージエンジンの内部形式およびサイズを含め、MySQL がサポートするデータ型ごとのストレージ要件に関するガイドラインおよび情報について説明します。 情報はカテゴリまたはストレージエンジンごとに示します。 テーブルの内部表現の最大行サイズは 65,535 バイトで
[Home] [Setting up Mac OS X] [Python]: [ファイルを読む] 日本語を使う Pythonで日本語を使う Python 2.4以降では、標準で日本語を扱うことができます。 PythonのソースコードをUTF-8で書くには 日本語を扱うPythonのスクリプトの中では、UTF-8の文字コードを使うのが 楽です。 Mac OS Xのターミナルで日本語を扱う場合は、 ここの「4. Terminalの設定を変える」の 指示に従ってください。 以下、ソースコードの簡単な例を示します。 #!/usr/bin/env python # -*- coding: utf-8 -*- import re jtext = u'子猫が隠れんぼをしています' print 'jtext has', len(jtext), 'Japanese characters.' if re.se
そう、Fedora Coreの文字コードはUTF-8なんですよね。 で、最初にEUCにしようかどうか迷ったんですよ。 で、結局今更EUCもいやなんでUTFのままにしたんですよね。 SSHでのログインにはTeraTerm ProのUTF対応版があるからいいやと思いつつ。 気付いたら、FFFTPはUTF対応してないぢゃん!と。 日本語ファイル名もろ文字化けしてるぢゃん!と。 ちょっとどうしようかと思ってたところにFFFTP 1.92a UTF-8 対応私家版。 そぅ、これ使えば全く問題ないですな、 良かった良かった。 で、ちょっと間抜けなことをば試みる。 メイン機の//***.***.***.***/C$(=C:\)をサーバ機の/mnt/mdcにマウントして、それをFTP通して再度メイン機から見る。 あー・・・意味ねぇ。
家ではWinXPとLinux、会社ではLinuxを使っているのだが、家から会社のLinux(UTF8)にSSH経由のFTP接続をする際、FFFTPではファイル一覧のUTF8対応してないため漢字コードが化けるという問題があった。とりあえずNextFTPを使って代用してきたが、他のサーバにつなげるときにはFFFTPで、会社につなげるときだけNextFTPという使い方にそろそろ我慢できず、FTP UTF8というキーワードでぐぐってみたところ、FFFTPの改造方法が『後の末莉』さんのところにあるのを見つけた。おー!! (FFFTP本家) http://www2.biglobe.ne.jp/~sota/ffftp.html (FFFTPのUTF-8対応改造) http://homepage1.nifty.com/kisa/dailylife/diary/200502t.html それを参考にしながら
「文字コード」カテゴリーの人気ランキング nkf.exe nkf32.dll Windows用 ネットワーク用漢字コード変換フィルタ シフトJIS,EUC-JP,ISO-2022-JP,UTF-8,UTF-16(ユーザー評価:0) KanjiTranslator 大量のファイルの文字コード(及び改行コード)を一括して変換(ユーザー評価:4) CharsetConverter Shift_JIS EUC-JP ISO-2022-JP Unicode UTF8 相互変換(ユーザー評価:4) 漢字コード変換モジュール For VB6/VBA シフトJIS/JIS/EUC/Unicode間の文字コード変換と認識を行うVB6/VBA用モジュール(ユーザー評価:0) RTFコンバータ リッチテキストファイルやテキストファイルの文字コード変換 多言語対応(ユーザー評価:4.5) 「テキストファイル用」カ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く