[B! 文字コード] noteiのブックマーク

Paken.NET | TCHAR型のススメ

C/C++でWindowsプログラミングをやり始めたとき、誰もが一度は嫌になるあの謎のデータ型。 "LPCTSTR"なんてのはその典型例です。しかし、これが何かを知らぬまま放っておいてる、ということが意外とありがちなんですよね。というわけで、一応簡単に解説しておくことにしよう、と思ったまでです。 ※ 開発環境は、Microsoft Visual C++ 2005 を想定しています。１．UNICODE 文字コードとはつまり、数値と文字の関係を示したものです。文字'a'は128で表し、文字'b'は129で表し・・・と文字と数値が一対一で対応して定められています。(数値は適当です) UNICODEも、その文字コードの一種で、古い文字コードのASCIIに比べて新しいものです。 NT系のWindowsには全て対応しているので、現在のほとんどの環境がUNICODE対応となっています。だったら

notei 2010/05/06

文字コード

リンク

UnicodeとUTF-8の違いは？ - Humanity

という2chのスレがかなり勉強になったのでまとめ。少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合？)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記：簡単にまとめました。 1 ：デフォルトの名無しさん：2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 ：デフォルトの名無しさん：2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 ：デフォルトの名無しさん：2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 ：デフォルトの名無しさん：2007/04/

notei 2009/11/30

文字コード

リンク

UNICODEを使用したプロジェクトでのCStdioFile

※前のblogから記事を移動。元の公開日：2006/09/25(月) 21:17:41 --- VC++2005のプロジェクトでUNICODE文字セットを使用する場合， CStdioFile::WriteStringで日本語を書こうとしても書けない． 1. locale.hをインクルード 2. WriteStringを呼ぶ前に_tsetlocale(LC_ALL,_T("")); 正しいかどうかは知らんけど動いたからok．

notei 2009/09/08

リンク

おぼえがき。 » [PHP]半角←→全角の変換方法

mb_convert_kana（特定の日本語の文字を半角カナにしたり、全角英数を半角英数にしたい場合などに用いられる関数）を使う書式 $str = mb_convert_kana(変換元の変数,オプション,文字エンコーディング); 例 /* すべて半角に変換 */ $str= mb_convert_kana($str,"rnask","Shift_JIS"); /* すべて全角に変換 */ $str = mb_convert_kana($str,"RNASKV","EUC-JP"); オプション r : 「全角」英字を「半角(ﾊﾝｶｸ)」に変換 R : 「半角(ﾊﾝｶｸ)」英字を「全角」に変換 n : 「全角」数字を「半角(ﾊﾝｶｸ)」に変換 N : 「半角(ﾊﾝｶｸ)」数字を「全角」に変換 a : 「全角」英数字を「半角(ﾊﾝｶｸ)」に変換 A : 「半角

notei 2009/04/26

リンク

mb_convert_kana()関数/PHP関数リファレンス

◆ 関数リファレンス mb_convert_kana( ) 引数で指定した文字列を第２引数で指定した変換オプションに従って変換します。また、第３引数には出力する文字エンコーディングを指定できますが、省略すると内部文字符号でエンコードされます。なお、変換オプションの値は以下のとおりです。 Option意味

notei 2009/02/27

リンク

php:バイト数の取得（strlen は mb_strlen にオーバーロードされる）: Script雑感

長い間スクリプト使い続けてきて今更ながら覚え書きをしようと一念発起。まー。節操もなく色々手を出しています。これからも。 JavaScript / PHP が主なところかな？ strlen が mb_strlen にオーバーロード(置換)されてしまっている場合でも支障なくデータのバイト数を取得する方法です。環境によっては strlen は ms_strlen にオーバーロードされているんですが（マニュアル：XCIV. マルチバイト文字列関数）、そんな場合、データのバイト数を取得するのに通常はどうするのでしょう？ $volm = strlen(bin2hex($data)) / 2; $data：バイト数を取得したいデータ $volm：データ長（byte）これでマルチバイトのテキストでも画像でも、バイト数を取得できます。当たり前ですが。ちなみに関数のオーバーロードに関する設定（mbst

notei 2009/01/27

リンク

ギャル動画の専門サイト | takeoba.com

欧美性爱在线,欧美性爱在线播放,欧美性爱在线观看,欧美性爱在线视频,特殊按摩让少妇高潮连连,日韩av影院在线观看,无码潮喷中文字幕在线视频

notei 2009/01/27

リンク

mb_strlen関数 - こもろぐ @tenkoma

ちょっと悩んだ。コード <?php $str = "あいう"; print "{$str}は " . strlen($str) . "バイト, " . mb_strlen($str) . " 文字<br/>\n"; ブラウザ表示あいうは 9バイト, 9文字おかしい。「3文字」になるはず…PHP: mb_strlen - Manualを見ると第二引数に文字エンコーディングを指定できるとあるので、「mb_strlen($str, 'utf-8')」とすると、目的の「3文字」が出力された。また、省略されたときは、内部文字エンコーディングが使われる、ともあるが、開発環境のphpinfo()のmbstring.internal_encodingに設定がされていなかった。なるほど。

notei 2009/01/27

リンク

ＣＧＩで特定の文字（表・予・申・能など）が文字化けする

・ＣＧＩで特定の文字（表・予・申・能など）が文字化けする自動バックアップ・テスサーバー付きの新機能スマートリリース CGIやPHPなどの技術系でSuper FAQ（よくある質問）がこれです。下記のような文字化けが発生します。文字化けしている漢字は「表」「予」「申」「能」「十」「ソ」などです。第１章の「Netscape4.Xのdocument.write時の文字化け」は音が「シ」のものに集中的に文字化けが見られるなど、顕著な規則性がありました。今回の文字化けは、「音」が似通っているという特色はありません。しかし、それぞれの漢字のShift_JISコードを調べてみると、ある規則性が浮かび上がってきます。Shift_JISコードを調べるには、序論で紹介したようなIMEやことえりの文字一覧表でもいいのですが、ここではURLエンコードを利用してみます。 URLエンコードは、プログラマーでない方

notei 2008/10/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

文字コードに関するnoteiのブックマーク (9)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス