utf8 だと日本語はバイト数がめんどいことに・・・。 文字コードはプログラムする上で永遠の敵かも・・・。 やりかた。 use Encode qw(decode); my $text = 'utf8で書かれた日本語'; my $length = length(decode('utf-8', $text)); 簡単にでけた。 改行がはいるとずれるので、改行が入っている文字列をやるときは、改行取り除いてくだされ。
Webサイトを作っていると、文字コードの取り扱いで困ることがある。 テキストデータの文字コードを、SJIS(Shift JIS)からUTF-8に変換するとき、文字化けが起こった。 ●波ダッシュ問題 代表的な文字化けの例として、いわゆる「波ダッシュ」問題がある。 波ダッシュ - Wikipedia Unicodeに関連する問題 Unicodeの仕様書では、U+301C WAVE DASH(波ダッシュ)に、「JIS punctuation」という注釈を施しておきながら、JIS X 0208の波ダッシュの例示字形(“上がって下がる” 形)とは異なる形(“下がって上がる”形)を印刷してしまった。 この影響を受けて、Microsoft Windows(XP以前)ではUnicodeの波ダッシュ(U+301C, WAVE DASH)は“下がって上がる”形で表示される。 このWindows独自のUnico
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く