タグ

文字コードに関するbayanのブックマーク (11)

  • PHPの文字化けを本気で解決する - ぎじゅっやさん

  • PHPでの文字化けというかコード変換に関する注意 - 現象派と理論派の対立。

    追記 いぇーい。ツッコんでもらえたぜ。id:elf:20070905 ハードコードしたやつをそのままechoしたらアカンでというメモだったんだけど、ちゃんと突っ込んでもらえた。mb_regex_encoding()というのは、気付いていませんでした。ありがとうございます。でもほとんどの場面で、preg_match()を使用しているのでどういう使い方をするか迷うところです。 文 EUC-JPだけで文字化け知らずでいたのだが、UTF-8で多国語対応にするのにはまってしまった。 まずは結論から。 PHPの http_output(), mb_internal_encoding()とかの mb_string系の設定はわけわからん。したがって自動変換をしないようにするのが最も早い解決法だ。*1 HTMLのヘッダでのエンコード宣言と実際の出力コードの違いが、混乱の元になっていたように思う。きちんと統

    PHPでの文字化けというかコード変換に関する注意 - 現象派と理論派の対立。
  • 文字コードまめ知識

    ■ JISX0208 → SJIS コードから 0x2121 を引く (コード & 0x100) が0でなければ コードに 0x9E, 0ならばコードに 0x40 を足す 下位バイトが 0x7F 以上ならば コードに 1 を足す [上位バイトだけの処理] 上位バイトを右に1ビット シフトし、それに 0x81 を足す (0xA000 ■ SJIS → JISX0208 (0xE000 [上位バイトのみ] 上位バイトから 0x81 を引き 1ビット左にシフトする 下位バイトが 0x80 以上ならコードから1を引く 下位バイトが 0x9E 以上ならコードに 0x100 を足し、 コードから 0x9E を引く。 そうでなければコードから0x40 を引く コードに 0x2121 を足す。

  • http://www.yk.rim.or.jp/~tabby/letter/spill.htm

  • 文字コードの部屋 -- Web のエンコード

    ホームページの HTML 文書に使用するエンコード 目次 ページ作成にはどのコードが良いか? 美乳テーブル <META> タグの charset 指定 1. ページ作成にはどのコードが良いか? 21 世紀、ブラウザのじゅうぶんに進歩した今の時代、もはや シフト JIS EUC JIS コード どれでも構いません。あなたが一番便利だと思うものを選ぶとよいでしょう。特に思いつかなければ、あなたの OS が得意とするコードでよいでしょう。 エンコード判別のロジックの観点からすれば、EUC が一番判別を誤りやすく、文字化けしやすいです。Shift_JIS は判別が比較的容易です。JIS コードはほぼ間違うことは無いでしょう。しかし、もはや 95 %のユーザが使っているブラウザは、EUC コードですら、ほとんど判別を誤ることはありません。 さらに、どのコードが日語サイトに最もふさわしいというコンセ

  • 文字コードについて

    文字コード、標準化について 文字コードについての実用的な説明です。 文字コード表 JIS X 0201、JIS X 0208、JIS X 0213のJIS、EUC-JP、Shift_JIS、Unicodeの文字コード表と、JIS X 0221のUnicodeの文字コード表です。 JIS X 0211 の制御コード表(JIS制御コード) JIS X 0201 の文字コード表(JISローマ字:ASCII、JISカナ) JIS X 0201 の文字コード一覧(Unicode対応) JIS X 0208 の文字コード表(JIS漢字:第1・第2水準) JIS X 0208 の文字コード一覧(Unicode対応) JIS X 0213 の文字コード表(JIS漢字:第1・第2・第3・第4水準) [UTF-8テキスト版] Unicode、常用漢字、人名漢字対応 JIS X 0213 の文字コード一覧 [U

  • PHP: マルチバイト文字列 関数 - Manual

    リファレンス マルチバイト文字エンコーディングおよびそれに関連する問題は非常に複雑で、 このドキュメントの範囲を超えています。これらの問題に関連するより詳細な情報は、 以下の URL やその他のリソースを参照ください。 Unicode について » http://www.unicode.org/ 日語/韓国語/中国語文字に関する情報 » https://resources.oreilly.com/examples/9781565922242/blob/master/doc/cjk.inf 目次mb_check_encoding — 文字列が、指定したエンコーディングで有効なものかどうかを調べるmb_chr — Unicode のコードポイントに対応する文字を返すmb_convert_case — 文字列に対してケースフォールディングを行うmb_convert_encoding — ある文

    PHP: マルチバイト文字列 関数 - Manual
    bayan
    bayan 2006/11/30
    SJIS-Win,eucJP-win,サポートされる文字エンコーディング
  • 文字セットサポート

  • nkf Network Kanji Filter プロジェクト日本語トップページ - OSDN

    インストール Makefile があるので、 CC CFLAGS PERL が正しいかどうかを確認して、make してください。Linux, Solaris, Mac OS X で動作確認しています。 mkstemp がない場合は、config.h の #define OVERWRITE をコメントア... インストール方法を見る 使い方 nkf - ネットワーク用漢字コード変換フィルタ SYNOPSISnkf B<[-butjnesliohrTVvwWJESZxXFfmMBOcdILg]> B<[>I<file ...>B<]> DESCRIPTIONnkf はネットワークでメールやニュースの読み書き... 使い方を見る

    nkf Network Kanji Filter プロジェクト日本語トップページ - OSDN
  • PHP: pg_set_client_encoding - Manual

    Getting Started Introduction A simple tutorial Language Reference Basic syntax Types Variables Constants Expressions Operators Control Structures Functions Classes and Objects Namespaces Enumerations Errors Exceptions Fibers Generators Attributes References Explained Predefined Variables Predefined Exceptions Predefined Interfaces and Classes Predefined Attributes Context options and parameters Su

    bayan
    bayan 2006/09/28
    成功時に 0 を返すってどうよ
  • 1