タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

unicodeと文字コードに関するKimuraのブックマーク (2)

  • 文字コード考え方から理解するUnicodeとUTF-8の違い | ギークを目指して

    UnicodeとUTF-8の違いを理解していない方が結構居るようなので、文字コードの考え方を元に解説してみようと思う。 文字コードとは何か? 文字コードとは、コンピュータ上で文字を扱うために、文字に対して割り当てられた数値のことであり、文字と数値の対応付けと呼べる。 この対応付けの種類は沢山あって、Shift-JISであったり、UTF-8であったりする。 以上!と言いたいけど、文字コードはこんなに単純ではない。文字コードを複雑にする要素は沢山あるが、今回の記事ではUnicodeとUTF-8の違いに焦点を絞って解説してみたいと思う。 文字コードの構成要素 文字コードの世界は以下の2つの要素で構成されている。 この違いを意識しておかないと混乱を招くだろう。 (1).文字集合 – 表現したい文字の範囲(”あ”、”い”・・・といった文字の集合体) (2).符号化方式 – 文字集合を構成する個々の文

    文字コード考え方から理解するUnicodeとUTF-8の違い | ギークを目指して
    Kimura
    Kimura 2016/12/16
    モヤモヤしていた頭の中の霧が晴れた感じ。UnicodeとUTF-8の違いについて非常にわかりやすく書かれている。
  • Unicode::Japanese::JA

    NAME Unicode::Japanese::JA - 日語文字コード変換 概要 use Unicode::Japanese; use Unicode::Japanese qw(unijp); # convert utf8 -> sjis print Unicode::Japanese->new($str)->sjis; print unijp($str)->sjis; # same as above. # convert sjis -> utf8 print Unicode::Japanese->new($str,'sjis')->get; # convert sjis (imode_EMOJI) -> utf8 print Unicode::Japanese->new($str,'sjis-imode')->get; # convert zenkaku (utf8) -> hank

    Unicode::Japanese::JA
    Kimura
    Kimura 2011/08/04
    [Unicode::Japanese]Unicode::Japaneseにある公式ドキュメント。日本語だからわかりやすい。でもここに書いていない機能があるんだよ。$s->set($str)->h2zKana->sjisとか
  • 1