タグ

文字コードに関するhaseharuのブックマーク (6)

  • iconvコマンドの使い方 - とあるソフトウェア開発者のブログ

    Unix/Linuxで文字コード変換に使用される、iconvコマンドの使い方についてのメモ書きです。*1 iconvコマンドの基的な使い方 オプションの指定方法 入力データの文字コード 「-f (--from-code)」で指定する。 出力データの文字コード 「-t (--to-code)」で指定する。 省略すると、ロケールから自動的に決定される。 入力データ 標準入力から読み込む。(リダイレクト or パイプ) コマンドの引数として指定してもよい。 出力データ 標準出力に書き込む。(リダイレクト or パイプ) 「-o (--output)」で指定してもよい。 #標準入出力を使う例 iconv -f SJIS -t UTF8 < sjis.txt > utf8.txt #標準入出力を使わない例 iconv -f SJIS -t UTF8 sjis.txt -o utf8.txt 複数フ

    iconvコマンドの使い方 - とあるソフトウェア開発者のブログ
  • ISO/IEC 8859-1 - Wikipedia

    ISO 8859-1(より正式にはISO/IEC 8859-1)はISO/IEC 8859の第一部であり、ラテンアルファベットの文字コード標準である。よりくだけた言い方ではLatin-1と呼ばれる。最初はISOによって開発されたが、後にISOとIECによって合同で保守されている。この標準に追加の文字を(16進符号0x00-0x1Fの「C0領域」と、0x80-0x9F「C1領域」の範囲に)割り当てたものは、2つの広く使われているキャラクタセットの基となる。ISO-8859-1(余分なハイフンに注意)とWindows-1252と呼ばれるものである。 2004年6月、8ビット符号化文字集合の整備を担当するISO/IECの作業部会は、国際符号化文字集合 (UCS) とUnicodeの開発に専念するために解散し、ISO 8859-1を含むすべてのISO 8859の整備を中止した。コンピュータアプリケ

  • 文字コード宣言は行いましょう(HTML) - Web標準普及プロジェクト

    文字コード宣言は行いましょう(HTML) HTMLで日語を使用する場合、そのファイルの保存方法が複数存在します。 それはいくつかのルールを使用して日語を保存し、ブラウザがそのルールに則って読みとることで表示するためです。 このルールのことを文字の符号化方式と言います。 何故文字コードの宣言が必要なのか 保存する時の文字コードとブラウザが読みとる時に使う文字コードが違っていると文字化けが発生してしまいます。 これは一部の符号化方式を除き、そのファイルがどのような文字コードで保存されたものなのかをブラウザが判別できる確実な手段が無いために発生します。 しかし、そのHTMLファイルの作者がブラウザに対してどのような文字コードで保存したのかを明示することによってブラウザは確実に表示できるようになります。 それが文字コードの宣言です。文字コードは次のようにmetaタグを使って宣言します。 ISO

  • 機種依存文字とUnicode - WebStudio

    導入 機種依存文字と呼ばれる文字があります。 例えばWindowsでは、 大文字のローマ数字(ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ)、 小文字のローマ数字(ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ)、 丸囲み数字(①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳)、 丸囲み文字(㊤㊥㊦㊧㊨)、 カタカナ表記の単位(㍉㍍㌔㌘㌧㌦㍑㌫㌢)、 単位記号(㎝㎏㎡)、 複数のアルファベットを合成した文字(㏍℡№)、 元号(㍻㍼㍽㍾)、 会社名等で用いられる括弧囲み文字(㈱㈲㈹)等が機種依存文字と呼ばれています。 機種依存文字は一般的に、異機種間でデータの交換を行った場合、 例えばWindowsで作成したテキストファイルをMacintoshで表示した場合に文字化けしてしまうので、 これら異機種でデータ交換することを前提としたインターネットでは利用するべきではないと言われています。 しかし、これらは機種依存文字と呼ばれているものの、 その意味はあ

    haseharu
    haseharu 2011/07/05
    キシュイゾンモジの冒険
  • 引用符 - Wikipedia

    引用符を用いて注意喚起をしている看板(日語) 引用符(いんようふ)は、約物の一つ。文中において、他の文や語を引用していることを示す役割を果たす記号で、多くの場合一対で引用部分を囲む。引用符号とも呼ばれ、またその英語からコーテーションマーク、クォーテーションマーク、クオーテーションマーク(quotation mark、スペイン語: comillas)と呼ぶ場合も多い。 類型[編集] 直線形[編集] 開始記号と終了記号が同じである。タイプライターやコンピュータで使用する。ただしUnicodeでは使用は推奨されない。なおU+0027の文字名称は歴史的な経緯から「アポストロフィー」となっているが、アポストロフィーとしての使用も推奨されず、閉じシングルクォートと同じU+2019を使う。 形 Unicode(十進) JIS X 0213 文字参照 名称 '…'

    引用符 - Wikipedia
  • Unicode nearing 50% of the web

    Hey—we've moved. Visit The Keyword for all the latest news and stories from Google

    Unicode nearing 50% of the web
    haseharu
    haseharu 2010/01/29
    おもしろいな、こういう統計
  • 1