[B! python][lib][textencoding] cu39のブックマーク

cu39 id:cu39

pythonとlibとtextencodingに関するcu39のブックマーク (3)

sourceforge.jp
We’re getting things ready Loading your experience… This won’t take long.
cu39 2010/04/07
ShiftJIS, EUC-JP, JIS相互変換。2.6未対応（ブクマ時点）。

coding

python

lib

textencoding
リンク
文字コード判定ライブラリ Universal Encoding Detector
Universal Encoding Detector は Mozillaのコードが移植された、文字コードを判定するライブラリです。とりあえずの使い方はとっても簡単で文字(列)をdetect()するだけで、推定されたエンコーディングと信頼度が返ってきます。サポートされている文字コードも文句ありません。「あ」1文字のように入力文字列が短すぎる場合の判定は常に信頼度0.505と出てましたがエンコーディングは合っていました。実用では1文字から推定するなんて皆無なので何も心配することはないでしょう。 < | >
cu39 2010/04/07
coding

python

lib

textencoding
リンク
Universal Encoding Detector: character encoding auto-detection in Python
Character encoding auto-detection in Python. As smart as your browser. Open source. >>> import urllib >>> urlread = lambda url: urllib.urlopen(url).read() >>> import chardet >>> chardet.detect(urlread("http://google.cn/")) {'encoding': 'GB2312', 'confidence': 0.99} >>> chardet.detect(urlread("http://yahoo.co.jp/")) {'encoding': 'EUC-JP', 'confidence': 0.99} >>> chardet.detect(urlread("http://amazo
cu39 2010/04/07
coding

python

lib

textencoding
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx