タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

文字に関するbellbindのブックマーク (1)

  • 講習会「文字集合と文字エンコーディング」を開催しました — ディノオープンラボラトリ

    「文字集合と文字エンコーディング」というタイトルで、経験2〜3年目の人をターゲットに社内勉強会を開催しました。文字集合という単語を知っている必要はないですけど、少なくともUTF-8とShift_JISとでは扱える文字の種類数が違うことだけは伝えたかったので、その意味では目標が達成できたと思っています。 まとめ 文字集合とは、扱える文字の集合 JIS X 0208なら6000文字くらいの日語の文字 UCS-2なら60000文字くらいの世界中の主要な文字 文字エンコーディングとは、文字の集合をバイト列に直す方式 Shift_JISはJIS X 0208(など)を1〜2バイトにする UTF-8はUCS-2を1〜3バイトにする 文字エンコーディング関連のツールを使いこなそう nkfやlvを使いこなそう 日語を探すならlgrep 最終兵器:hexjaで16進ダンプ ムービー

    bellbind
    bellbind 2009/04/21
    UCS2とUTF16は、番号と数値が同値でも、前者が「文字の集まり全体」を指し、後者がそういった文字集合上の番号とデータ表現との「変換手法」を指すもの。概念として区別したほうがいい。↓符号化とフォーマットは別物
  • 1