タグ

文字コードに関するhkataokaのブックマーク (3)

  • 鳩丸ご意見番 - 半角カナは機種依存文字か?

    よく、「半角カナは機種依存文字だ」と言う人がいます。しかし半角カナは機種依存文字なのでしょうか? 機種依存文字とは? そもそも「機種依存文字」という言葉の意味が曖昧です。特定の環境でしか表示できない文字、という定義は一見良さそうですが、たとえば、アメリカにある多くのマシンは日語の文字をまったく表示できないことでしょう。下手をすると、ASCII 以外の全ての文字が機種依存ということになりかねません。 普通、「機種依存文字」とは、「JISなどの規格によって定義されていない文字」という意味で使われます。JIS規格で定義されている文字ならば、他の環境でも表示されることを期待して良いというわけです。逆に、メーカーが独自に定義した文字は、他のメーカーの機種では表示される保証が全くありません。このようなものを機種依存文字と呼びます。 さて、話は戻って半角カナです。半角カナは「JIS X 0201カナ」

  • perlの波ダッシュの文字コード変換のまとめ - (゚∀゚)o彡 sasata299's blog

    2009年02月22日22:31 Perl perlの波ダッシュの文字コード変換のまとめ perlの文字コード周りはなかなかカオスです。外部エンコードとか、perl内部での文字コードとか、UTF8フラグとか。UTF8フラグ?なにそれ?な人は、こことかここを見てみると良いかも。(・∀・) 基的には外部から入ってきた時点でdecodeして、出力時にencodeしてやれば全て解決するんですが、「〜(波ダッシュ)」と「−(全角マイナス)」だけは特別です。注意が必要なのはこの2パターン。 ① utf8⇔shift_jis ② utf8⇔euc-jp ①については以前、perl utf8→sjisで文字化けという記事で紹介しましたが、encode時に、'sjis'では無くて、'cp932'を指定すればOK。※「〜」とか「−」はsjisには含まれていない文字なのが原因。 今回紹介したいのは②の場合です

  • perl - $PerlIO::encoding::fallback の謎 : 404 Blog Not Found

    2009年07月07日07:30 カテゴリLightweight Languages perl - $PerlIO::encoding::fallback の謎 すびばせん。それ、ドキュメントバグです。 PerlIO の encoding layer の fallback ではまった - daily dayflower Encode - character encodings - search.cpan.org をみるとわかるように,FB_XMLCREF は XMLCREF | LEAVE_SRC なんだけど,いろいろ試行錯誤してるとどうやら LEAVE_SRC が悪さをするらしい。 $PerlIO::encoding::fallbackを指定するときは、FB_*を使ってはいけません。 今からその理由を説明します。 Encode::LEAVE_SRCって何さ? まずは、Encode::FB

    perl - $PerlIO::encoding::fallback の謎 : 404 Blog Not Found
  • 1