タグ

文字コードに関するpkerattaのブックマーク (7)

  • UTF-16 が単に Unicode と呼ばれることがある理由 - yanok.net

    Windowsのメモ帳でテキストファイルを保存するときに文字コードを選択できますが、その選択肢では「Unicode」と「UTF-8」が並列に置かれています。これに違和感を持つ人も少なくないでしょう。このことを強い調子でけなしている文章をネット上で見かけたので、ちょっとこの件について書いてみましょう。 実はここで「Unicode」と言っているのはUTF-16のことです。現在多くの人は、「Unicodeの符号化方式としてUTF-16やUTF-8がある」ものと理解しているでしょう。拙著でもそう説明しています。するとWindowsのメモ帳の開発者はUnicodeを分かっていないのでしょうか。いえ、そうとも限りません。 過去の経緯 Unicodeは元々、16ビット固定長の文字コードとして開発されました。ASCIIが7ビットで1文字を表すのと同じように、Unicodeは16ビット版のASCIIですよ、

  • 『プログラマのための文字コード技術入門』を読んだ - 夜は寝る

    圧倒的な雨により、引きこもりを余儀なくされていた。 Amazon・プライム・ビデオで『ソラニン』という映画をみた。 ソラニン 発売日: 2013/11/26メディア: Amazonビデオこの商品を含むブログを見る 青春の眩しさで目が潰れそうだった。 全フレームの全ピクセルで宮崎あおいが可愛かった。 桐谷健太に泣かされたし、ARATAが良かった。 どんな題です(だけに、ってね!)。 プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ) 作者: 矢野啓介出版社/メーカー: 技術評論社発売日: 2010/02/18メディア: 単行(ソフトカバー)購入: 34人 クリック: 578回この商品を含むブログ (129件) を見る 文字コード周辺の技術歴史をまるっとまとめたかんじの。「入門」とあるが表面的な内容だけで

    『プログラマのための文字コード技術入門』を読んだ - 夜は寝る
  • 文字コードUTF-8とは? 仕組みとコード表

    今回は、文字コードUTF-8の仕組みとコード表について説明します。意外と文字コードを意識している人は少ないので、ここでは一般的に使われるUnicodeのUTF-8をメインに説明します。 文字コードとは コンピューター上で利用する文字と、各文字に割り当てたバイトで表した数字との対応関係のことを言います。文字コードは、コンピュータが多くの言語圏で利用されるようになり、種類も多くなりました。代表的な文字コードは100種類以上とも言われています。 日でおもに使われている文字コードはつぎのとおりです。 JISコード 正式名称は「ISO-2022-JP」。電子メールで多く使われています。 SJIS(Shift-JIS)コード ASCIIコードに日語を加えたもので、国内携帯電話で使われています。 ASCIIとは、アルファベットや数字、記号などを収録したモジコードの一つ。最も基的な文字コードとして世

  • 文字コード考え方から理解するUnicodeとUTF-8の違い | ギークを目指して

    UnicodeとUTF-8の違いを理解していない方が結構居るようなので、文字コードの考え方を元に解説してみようと思う。 文字コードとは何か? 文字コードとは、コンピュータ上で文字を扱うために、文字に対して割り当てられた数値のことであり、文字と数値の対応付けと呼べる。 この対応付けの種類は沢山あって、Shift-JISであったり、UTF-8であったりする。 以上!と言いたいけど、文字コードはこんなに単純ではない。文字コードを複雑にする要素は沢山あるが、今回の記事ではUnicodeとUTF-8の違いに焦点を絞って解説してみたいと思う。 文字コードの構成要素 文字コードの世界は以下の2つの要素で構成されている。 この違いを意識しておかないと混乱を招くだろう。 (1).文字集合 – 表現したい文字の範囲(”あ”、”い”・・・といった文字の集合体) (2).符号化方式 – 文字集合を構成する個々の文

    文字コード考え方から理解するUnicodeとUTF-8の違い | ギークを目指して
  • 文字コード宣言は行いましょう(HTML) - Web標準普及プロジェクト

    文字コード宣言は行いましょう(HTML) HTMLで日語を使用する場合、そのファイルの保存方法が複数存在します。 それはいくつかのルールを使用して日語を保存し、ブラウザがそのルールに則って読みとることで表示するためです。 このルールのことを文字の符号化方式と言います。 何故文字コードの宣言が必要なのか 保存する時の文字コードとブラウザが読みとる時に使う文字コードが違っていると文字化けが発生してしまいます。 これは一部の符号化方式を除き、そのファイルがどのような文字コードで保存されたものなのかをブラウザが判別できる確実な手段が無いために発生します。 しかし、そのHTMLファイルの作者がブラウザに対してどのような文字コードで保存したのかを明示することによってブラウザは確実に表示できるようになります。 それが文字コードの宣言です。文字コードは次のようにmetaタグを使って宣言します。 ISO

  • URL エンコード/デコードフォーム 2

    URL エンコードされた文字列をデコード、もしくは文字列を URL エンコードします。 EUC-JP、Shift_JIS、JIS、UTF-8 に対応しています。 うまく動かない場合は従来版をお使いください。 入力フォーム 入力欄 文字列を入力してください モード エンコードする場合の文字コード 送信 「入力欄」のクリア Firefox の検索バーからデコード Firefox の検索ツールバーからデコードできるものを作成しました。 Context Search などの拡張機能と組み合わせることで、より便利になります。 URLデコード機能をFirefoxの検索バーに追加

    pkeratta
    pkeratta 2014/08/20
    Firefox の検索バーからデコード
  • NonSoft - ADODB.Streamによる文字コード変換のサンプル(VB6)

    文字コード判定/変換ツール(VB6のソース付) SJIS、JIS、EUC、UNICODE(UTF-16)、UTF-7、UTF-8の文字コード判定/変換(VB6のソース付) フォルダ内のファイル比較ツール フォルダ比較(2つのフォルダの比較、同一フォルダの時間差での比較、テキスト差分表示) テキスト差分表示ツール ファイル比較(2つのファイルの差分を表示)、文字コード自動判定、差分解析サンプルソース(VB6) アイドル☆バックアップ タスクトレイに常駐しバックアップ/フォルダ同期。処理に使用するCPU率指定で低負荷実行 その他のダウンロード たくさんの便利ツールを公開していますのでお試しください <このサンプルの概要> ADODB.Streamを使用しSJIS、JIS、EUC、UTF-7、UTF-8 からVB6内部文字コードであるUNIC ODE(UTF-16)に変換しま

  • 1