[B! UTF-8] kminoruのブックマーク

Pythonのお勉強 Part16

kminoru 2008/04/01

unicode() の第二引数や、encode()、decode() の第一引数を省略した場合にdefaultencoding が使われことを知っておくと混乱しないよ。

python
UTF-8

リンク

http://www.ajisai.sakura.ne.jp/~dindi/chrc/ref/wincode2.txt

kminoru 2008/03/24

文字コード関連

リンク

文字コードを変換するときに注意する文字 - kなんとかの日記

Pythonスレより。 144 名前: 136 Mail: sage 投稿日: 2008/03/02(日) 03:39:09 >>137 「〜」はEUC-JPとUTF-8を相互変換するときのテーブルがOS/言語ごとに違うために変換できなかったり違うグリフで表示されたりします。俺はよく使う文字について以下のようなコードでWindows用にそろえてます。 unification = { 0x2014: 0x2015, # HORIZONTAL BAR 0xFF5E: 0x301C, # WAVE DASH 0x2225: 0x2016, # DOUBLE VERTICAL LINE 0x22EF: 0x2026, # HORIZONTAL ELLIPSIS 0xFF0D: 0x2212, # MINUS SIGN 0xFFE0: 0x00A2, # CENT SIGN 0xFFE1: 0x

kminoru 2008/03/24

pythonのcodecs変換にてはEUC-JPとUTF-8を相互変換するときのテーブル

リンク

Servlet Garden » Unicode and Character Sets (Translation)

勉強を兼ねての勝手に翻訳シリーズ第3弾です。今回はJoel Spolsky氏のブログに掲載されていたThe Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)です。掲載されたのは2003年10月と、5年近く前のことなので、現状にそぐわないところもあるかもしれませんが、とても参考になる解説です。ソフトウェ開発者なら絶対に最低限知っていなければならないユニコードと文字セットについて（言い訳はなしですよ！）不可解なContent-Typeタグについてかつて疑問に思ったことはないでしょうか？おそらくHTMLファイルに書き込むものということは知ってるでしょうが、なんのためにそれなければいけないのかまでは知ら

kminoru 2008/02/03

htmlで<meta http-equiv=“Content-Type”が最初に必要な理由。あと、文字コードを考えた国際的なソフト開発の基礎

リンク

azito.com

This domain may be for sale!

kminoru 2007/08/21

stringとunicode型によって、ただのバイト列にして取得するか、unicodeにデコード/エンコードするかのちがいが大きい

リンク

Unihan Database Lookup

About the Unihan Database Lookup Tool The lookup interface on this page provides online access to property data in the Unicode Han (Unihan) database for individual ideographs via the “Lookup” button and text field above. Simply enter the four- or five-digit hexadecimal code point for the desired ideograph into the text field, or copy and paste the ideograph into it, then click the “Lookup” button.

kminoru 2007/08/08

unicode文字列検索

リンク

Python で日本語を扱う基本をまとめてみるメモ(その1) - 猫(=・ω・=)顔 1.0β

久々の Python ネタ! (=´ω｀=)ノ 1ヶ月ぐらいかけてようやくこの本: 速効!Pythonプログラミングバージョン2.5対応作者: 上平哲出版社/メーカー: 秀和システム発売日: 2007/04/27メディア: 単行本購入: 1人クリック: 29回この商品を含むブログ (15件) を見るを読み終えた！「EUC とか UTF とかのエンコーディング方法をキチンと処理するための Python の正しいお作法ってどうなの？」というのが知りたくてヨドバシの書籍コーナーでいろいろ物色してこの本を選んだのだが、それがとても丁寧にかかれてて良かった。日本語に関してだけじゃなく、全般的に例が多くて丁寧。言語仕様からこういう結果になる、という説明じゃなく、こう書くとこういう理由でこう動く、という事例オリエンテッドな感じで Python 初心者な自分には読みやすかったっす。っつーことで、以

kminoru 2007/08/08

よくまとまってていいよー。すばらしす

リンク

Blog - Mikula Beutl - SEO Consulting

This guide is the safest way to do a domain switch, you get all you need to change a blocked domain. What is a user flow and a user journey? There’s a macro view of a customer experience that we can analyze and partially control.

kminoru 2007/06/14

日本語変換

UTF-8
linux

リンク

JavaScript++かも日記 - 1997年からの

Testnetがアップデートされたのは知ってたけれど、libra-authのデモも動かなくなったのでちょっと調…

kminoru 2006/12/26

リンク

VistaでUnicode以外の選択肢はなかったのか？──京大の安岡助教授が語る

「『JIS X 0213』の基本的な考えは，必要な漢字を使いたくても使えなくて困っている人たちを助けることだった」。こう語るのは，京都大学人文科学研究所附属漢字情報研究センター助教授の安岡孝一氏。1997年以来JISの委員としてJIS規格の文字コード（「JIS X 0213」や「JIS X 0213:2004」など）の策定にかかわってきた安岡氏に，最近の文字コードの変遷や，Windows VistaにおけるJIS X 0213対応に関する見解を聞いた。 ──JIS X 0213の概要や，それが2004年に改訂された経緯などを教えてほしい。安岡氏：過去に使われていた文字集合「JIS X 0208」や「JIS X 0212」には，日本の地名で使われている文字が抜けているなど，重要な文字の不足がありました。ただしこの問題は，そこに住む地元の人は困っていても，日本全体で見るとほとんどの人が困って

kminoru 2006/12/26

文字コードと文字セットについて

リンク

Gentoo Linux を UTF-8 ベースにする - WebOS Goodies

Gentoo Linux の UTF-8 化については、 GentooでのUTF-8の使用方法で詳しく解説されています。基本的には、そこに書いてある方法に従えば大丈夫です。ここでは、 "ja_JP.utf8" ロケールを使用することを前提にして、具体的な手順をご紹介します。まずは、 "ja_JP.utf8"（"ja_JP.UTF-8" かもしれません）ロケールが利用可能かどうかを確認しましょう。以下のコマンドを実行して "ja_JP.utf8"（もしくは "ja_JP.UTF-8"）が表示されれば OK です。設定で明示的に抑制していない限りは大丈夫なはずですが・・・。 locale -a | grep 'ja_JP' もし表示されなければ、以下のコマンドで作成できます。 localedef -i ja_JP -f UTF-8 ja_JP.utf8 なお、 GentooでのUTF-8の使

kminoru 2006/12/18

リンク

はてなブックマーク

タグ

関連タグで絞り込む (10)

UTF-8に関するkminoruのブックマーク (11)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス