タグ

charsetに関するhiroki_gsのブックマーク (7)

  • PHPにおけるUnicode文字列の正規化:CodeZine

    はじめに 与えられた文字列を含む文書を返す検索機能を実装しているところを想像してください。 検索語として「ページ」が与えられれば、「ページ」という文字列を含む文書を返します。これは特に難しいことではありません。 半角の「ページ」が与えられたらどうでしょう。「ページ」と「ページ」を区別する必要がないような、一般的な文書検索においては、「ページ」という文字列を含む文書を返すのが望ましいはずです(もちろん、この2つは常に同一視できるわけではありません。同一視できない例として稿があります)。 もしかしたら、「㌻」で検索しようとする人がいるかもしれませんし、日語を母国語としない人が、「ぺ」(「ヘ」と半角の半濁点「゚」)や「ヘ゜」(半角カナ「ヘ」と半濁点「゜」)を使うかもしれません。 人間なら簡単に対応できることですが、コンピュータで対応するには特別な処理が必要になります。例えばUnic

  • Chars NOT in JIS X0208

  • 楓 software: libiconvを使おうとしたが

  • Download Visual Studio 2005 Retired documentation from Official Microsoft Download Center

    All Microsoft Global Microsoft 365 Teams Copilot Windows Surface Xbox Deals Small Business Support Software Windows Apps AI Outlook OneDrive Microsoft Teams OneNote Microsoft Edge Skype PCs & Devices Computers Shop Xbox Accessories VR & mixed reality Certified Refurbished Trade-in for cash Entertainment Xbox Game Pass Ultimate PC Game Pass Xbox games PC and Windows games Movies & TV Business Micro

  • 書体関係 Wiki - unixuser200403-1

    なお、CSS (Cascading Style Sheets) 2 *5では font-weight プロパティに相当し、直接指定では「100, 200, 300, 400, 500, 600, 700, 800, 900, normal (400 と同じ), bold (700 と同じ)」を用い、間接指定では「bolder (次に太い書体), lighter (次に細い書体), inherit (親要素と同じ)」を用いる。 字幅 (ワイズ) 字幅を表す言葉も書体によって若干のバリエーションがあるのだが、通常の字幅のものはレギュラーまたはノーマル、幅の狭いものはナローまたはコンデンス、幅の広いものはエクスパンドまたはワイドと呼ぶ。 CSS 2 では font-stretch プロパティに相当し、直接指定では狭いものから順に「ultra-condensed, extra-condensed,

    hiroki_gs
    hiroki_gs 2007/03/29
    文字集合と文字コードについて
  • 文字コードについて

    文字コードについての実用的な説明です。 このページの仕様にもとづいて作成した文字コード表や、16進ダンプを使った解説のページもあります。 文字の種類 1バイト・2バイト文字は、ローマ字、カナ、記号などのJIS非漢字と、第1・第2・第3・第4水準のJIS漢字に分類され、JIS規格によって決められています。 この他に、制御コードと呼ばれるデータがあり、文字と同様に扱っています。 また漢字は、94×94の領域に1字づつ配置されています。 この横の行を区、縦の列を点と呼び、区点番号で表すこともあります。 これに対して、UCS(Universal Coded Character Set)のマルチバイト文字では、全世界の文字を扱えるようにISO/IECで決められた国際規格です。

  • @IT:Windows TIPS -- Tips:ファイルの文字コードを変換する

    Windows OSや、UNIX/Linuxなど、マルチプラットフォーム環境で作業を行っている場合、文字コードの差異に悩まされる状況は少なくない。例えば、Windows環境で作成したソース・コードをUNIX/Linux環境で動作させるようなケースでは、いちいちShift_JISで記述したコードをEUC-JPに変換するなどの必要がある。 しかしサンプルを用いることで、特定のフォルダ配下に納められたテキスト・ファイルの文字コードを一括で変換することができる。フォルダ配下のサブフォルダまで再帰的に処理されるため、対象ファイルの指定もシンプルだ。あるプロジェクトに属するファイル一式を、一気に変換したいという場合などに威力を発揮するだろう。 なおTIPSを利用するには、Basp21という、メール送信/コード変換用の追加コンポーネントがコンピュータにインストールされていることが条件となる。コンポー

  • 1