文字コードに関するnoteiのブックマーク (9)

  • Paken.NET | TCHAR型のススメ

    C/C++Windowsプログラミングをやり始めたとき、誰もが一度は嫌になるあの謎のデータ型。 "LPCTSTR"なんてのはその典型例です。 しかし、これが何かを知らぬまま放っておいてる、ということが意外とありがちなんですよね。 というわけで、一応簡単に解説しておくことにしよう、と思ったまでです。 ※ 開発環境は、Microsoft Visual C++ 2005 を想定しています。 1.UNICODE 文字コードとはつまり、数値と文字の関係を示したものです。 文字'a'は128で表し、文字'b'は129で表し・・・と文字と数値が一対一で対応して定められています。(数値は適当です) UNICODEも、その文字コードの一種で、古い文字コードのASCIIに比べて新しいものです。 NT系のWindowsには全て対応しているので、現在のほとんどの環境がUNICODE対応となっています。 だったら

  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • UNICODEを使用したプロジェクトでのCStdioFile

    ※前のblogから記事を移動。元の公開日:2006/09/25(月) 21:17:41 --- VC++2005のプロジェクトでUNICODE文字セットを使用する場合, CStdioFile::WriteStringで日語を書こうとしても書けない. 1. locale.hをインクルード 2. WriteStringを呼ぶ前に_tsetlocale(LC_ALL,_T("")); 正しいかどうかは知らんけど動いたからok.

  • おぼえがき。 » [PHP]半角←→全角の変換方法

    mb_convert_kana(特定の日語の文字を半角カナにしたり、全角英数を半角英数にしたい場合などに用いられる関数)を使う 書式 $str = mb_convert_kana(変換元の変数,オプション,文字エンコーディング); 例 /* すべて半角に変換 */ $str= mb_convert_kana($str,"rnask","Shift_JIS"); /* すべて全角に変換 */ $str = mb_convert_kana($str,"RNASKV","EUC-JP"); オプション r : 「全角」英字を「半角(ハンカク)」に変換 R : 「半角(ハンカク)」英字を「全角」に変換 n : 「全角」数字を「半角(ハンカク)」に変換 N : 「半角(ハンカク)」数字を「全角」に変換 a : 「全角」英数字を「半角(ハンカク)」に変換 A : 「半角

  • mb_convert_kana()関数/PHP関数リファレンス

    ◆ 関数リファレンス mb_convert_kana( ) 引数で指定した文字列を第2引数で指定した変換オプションに従って変換します。また、第3引数には出力する文字エンコーディングを指定できますが、省略すると内部文字符号でエンコードされます。 なお、変換オプションの値は以下のとおりです。 Option意味

  • php:バイト数の取得(strlen は mb_strlen にオーバーロードされる): Script雑感

    長い間スクリプト使い続けてきて今更ながら覚え書きをしようと一念発起。 まー。節操もなく色々手を出しています。これからも。 JavaScript / PHP が主なところかな? strlen が mb_strlen にオーバーロード(置換)されてしまっている場合でも支障なくデータのバイト数を取得する方法です。 環境によっては strlen は ms_strlen にオーバーロードされているんですが(マニュアル:XCIV. マルチバイト文字列関数)、そんな場合、データのバイト数を取得するのに通常はどうするのでしょう? $volm = strlen(bin2hex($data)) / 2; $data:バイト数を取得したいデータ $volm:データ長(byte) これでマルチバイトのテキストでも画像でも、バイト数を取得できます。当たり前ですが。 ちなみに関数のオーバーロードに関する設定(mbst

  • ギャル動画の専門サイト | takeoba.com

    欧美性爱在线,欧美性爱在线播放,欧美性爱在线观看,欧美性爱在线视频,特殊按摩让少妇高潮连连,日韩av影院在线观看,无码潮喷中文字幕在线视频

  • mb_strlen関数 - こもろぐ @tenkoma

    ちょっと悩んだ。 コード <?php $str = "あいう"; print "{$str}は " . strlen($str) . "バイト, " . mb_strlen($str) . " 文字<br/>\n"; ブラウザ表示 あいうは 9バイト, 9文字おかしい。「3文字」になるはず…PHP: mb_strlen - Manualを見ると第二引数に文字エンコーディングを指定できるとあるので、「mb_strlen($str, 'utf-8')」とすると、目的の「3文字」が出力された。また、省略されたときは、内部文字エンコーディングが使われる、ともあるが、開発環境のphpinfo()のmbstring.internal_encodingに設定がされていなかった。なるほど。

    mb_strlen関数 - こもろぐ @tenkoma
  • CGIで特定の文字(表・予・申・能など)が文字化けする

    ・CGIで特定の文字(表・予・申・能など)が文字化けする 自動バックアップ・テスサーバー付きの新機能スマートリリース CGIやPHPなどの技術系でSuper FAQ(よくある質問)がこれです。下記のような文字化けが発生します。 文字化けしている漢字は「表」「予」「申」「能」「十」「ソ」などです。第1章の「Netscape4.Xのdocument.write時の文字化け」は音が「シ」のものに集中的に文字化けが見られるなど、顕著な規則性がありました。今回の文字化けは、「音」が似通っているという特色はありません。 しかし、それぞれの漢字のShift_JISコードを調べてみると、ある規則性が浮かび上がってきます。Shift_JISコードを調べるには、序論で紹介したようなIMEやことえりの文字一覧表でもいいのですが、ここではURLエンコードを利用してみます。 URLエンコードは、プログラマーでない方

  • 1