タグ

文字コードとまとめに関するiwwのブックマーク (5)

  • Content-type:text/htmlのcharset指定はUTF-8,utf-8,utf8どれが正しいの?調べてみた。 · DQNEO日記

    Home Subscribe UTF-8? utf-8? UTF8? utf8? 気になったので調べてみました。 結論 公式名称は "UTF-8" である。 UTF-8, a transformation format of ISO 10646 大文字小文字は区別されない。 UTF-8でもutf-8でもどちらでもいいようです。 " HTTP character sets are identified by case-insensitive tokens. " Hypertext Transfer Protocol -- HTTP/1.1 したがって、 Shift_JIS/shift_jis EUC-JP/euc-jp どちらでもOKということになります。 気になるあのサイトでは? 世の中的にはこうなっていました。(2011/8/17現在)

    Content-type:text/htmlのcharset指定はUTF-8,utf-8,utf8どれが正しいの?調べてみた。 · DQNEO日記
  • 【凄すぎ】劇場版『魔法少女まどか☆マギカ』EDで流れた魔女文字がついに解読される! : はちま起稿

    【ネタバレ注意】劇場版魔法少女まどか☆マギカ[後編 永遠の物語]に流れる魔女文字EDの日語完成版です。閲覧しやすい方でどうぞ。yfrog.com/eskqqlp twitpic.com/bfpwia #madoka_magica #まどかマギカ — とりさんさん (@Fau3) 11月 23, 2012 劇場版魔法少女まどか☆マギカ 後編ED魔女文字まとめ (完成) http://matome.naver.jp/odai/2135111135283389801 その ことばは きこえ なくとも むねの おくへは とどく はず あらゆる ものに すがたを かえて かがやく こなを まくのです まちの うえ でも なみの した でも わたしの ただ ひとりの ゆうじん よばれる ことの ない かわりには いつでも そこに いるのです うつろいゆく この すべては あおのひの きぼうの ひゆに

    【凄すぎ】劇場版『魔法少女まどか☆マギカ』EDで流れた魔女文字がついに解読される! : はちま起稿
  • いろんな日本語EUCについてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    語EUC(EUC-JP)にはいろいろあって頭がこんがらがってきたので、サルにもわかるように(つまり、自分があとから見て理解できるように)まとめてみた*1。まず、EUC-JPにはどんな種類があるのだろうということで、わたしの環境で実装例を確認できるものをピックアップしてみた。下図のうちeucJP-openとIANAのEUC-JPについては身近な実装例を思いつかなかったが、これを外すわけにはいかないだろうと思って入れておいた。 各EUC-JPのレパートリをまとめたのが、下図。eucJP-openには上図に示したようなバリエーションがあるが、レパートリは共通。「JIS X 0208の国際基準版・漢字用8ビット符号 + JIS X 0201片仮名」については、これを一言で表現できる呼称を思いつかないので、以下の図では仮に「TextEdit」と表記する。 下図は、各EUC-JPのレパートリと符号

    いろんな日本語EUCについてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • Perl の数値変換

    Last Updated: 2002/03/26 Perl で、16進文字列、10進整数、2進文字列、バイナリー文字列の相互変換を行うための、スクリプトメモです。 特に断っていない限り、Perl 5.001 以上で動作します。 目次 16進文字列からの変換 10進整数からの変換 2進文字列からの変換 バイナリー文字列からの変換 16進文字列→10進整数への変換 hex() 関数は、16進文字列を整数値に、手軽に変換できます。 $num10 = hex("4A"); # $num10 には 74 が入る $num10 = hex("FFFFFF"); # $num10 には 16777215 が入る 余談ですが、数値リテラル中では 0x に続けて 16 進数で記述することで、数値を表すことができます。 $num10 = 0x4A; # 74 $num10 = 0xFFFFFF; # 1677

    iww
    iww 2010/08/30
  • [Java] UTF-8での文字化け

    以前のエントリーOracleJavaの間で、全角マイナスが文字化け。 - mokkouyou2001の日記 にも少し関係。 IBM-Unicode(標準Unicode)と、MS-Unicodeの間でも以下の差がある。 特に問題は無い場合が多いかもしれないが、外部向けのやり取りの1部にMS932(のファイルでのやりとり)がある。 という場合はMS-Unicode向けの変換をかませておくのが無難かもしれない。 というか、まぁ検索のことを考えたりするとどちらかに寄せるのが無難か・・・ なんでこんなことが起こるかなぁ・・・ 悩ましいねぇ。 文字 IBM-Unicode MS-Unicode ―(全角ダッシュ)*1 U+2014 U+2015 〜 U+301C U+FF5E ‖ U+2016 U+2225 −(全角マイナス) U+2212 U+FF0D ¢ U+00A2 U+FFE0 £ U+00

    [Java] UTF-8での文字化け
  • 1