タグ

文字コードに関するfrsh_mtのブックマーク (5)

  • Ruby1.9をこれから使う人のためのM17Nまとめ

    仙台Ruby会議01で発表した内容のM17Nの部分をまとめました。 これから1.9を使う人の参考になればと思います。 重要なこと Stringのインスタンスが Encoding情報を持つようになりました 利用者は常にこのことを意識する必要があります。 1.9のStringには次のようなメソッドが追加されています String#encoding 現在のencodingを返します。 "牛タン".encoding => #<Encoding:UTF-8> String#force_encoding(encoding) データはそのままで、encoding情報のみ変更します。 バイト列自体は変更されません。 破壊的に変更されます。 "牛タン".force_encoding("EUC-JP") => "\xE7\x89\x9B\xE3\x82??\x83\xB3" String#encode(enc

    Ruby1.9をこれから使う人のためのM17Nまとめ
  • vimエディタで「文字コード、改行コードを変更して保存する。」

    vimエディタで、ファイルの文字コード、改行コードを修正、もしくは変更する時の話。 ファイルの文字コードや、改行コードを変更する時は、 変更したいファイルを開いた状態で、 ・文字コードの変更 :set fileencoding=文字コード :set fenc=文字コード (上のコマンドの短い形式。こちらでも良い。) :set fileencoding=euc-jp (エンコーディングEUC-JPに変更。) :set fileencoding=shift_jis (エンコーディングSHIFT_JISに変更。) :set fileencoding=utf-8 (エンコーディングUTF-8に変更。) ・ファイルフォーマットの種類の変更 :set fileformat=ファイルフォーマットの種類 :set ff=ファイルフォーマットの種類 (上のコマンドの短い形式。こちらでも良い。) :set f

    vimエディタで「文字コード、改行コードを変更して保存する。」
  • 文字コード宣言は行いましょう(HTML) - Web標準普及プロジェクト

    文字コード宣言は行いましょう(HTML) HTMLで日語を使用する場合、そのファイルの保存方法が複数存在します。 それはいくつかのルールを使用して日語を保存し、ブラウザがそのルールに則って読みとることで表示するためです。 このルールのことを文字の符号化方式と言います。 何故文字コードの宣言が必要なのか 保存する時の文字コードとブラウザが読みとる時に使う文字コードが違っていると文字化けが発生してしまいます。 これは一部の符号化方式を除き、そのファイルがどのような文字コードで保存されたものなのかをブラウザが判別できる確実な手段が無いために発生します。 しかし、そのHTMLファイルの作者がブラウザに対してどのような文字コードで保存したのかを明示することによってブラウザは確実に表示できるようになります。 それが文字コードの宣言です。文字コードは次のようにmetaタグを使って宣言します。 ISO

  • 日本語ファイル名

    まだよくわかっていないことが多いので,お気づきの点がありましたらご教示ください。 [2006-05-08] WindowsのIEで化けていた(^^;)ので直しました。 [2007-03-14] IE5/6はUTF-8をURLエンコードした名前でもOKだそうです(Thanks: 白水さん)。 問題点 日語ファイル名の扱い方はブラウザによって異なり,たいへん厄介です。 まず,ファイル名はURLのパスとして与えることができます: <a href="fakefile.php/日語ファイル名.txt">クリックしてね</a> この場合,ブラウザは「日語ファイル名.txt」というファイルを見ているつもりになりますが,サーバ側では fakefile.php を実行し,/日語ファイル名.txt はその実行の際に環境変数 PATH_INFO として渡されるだけです。 また,ファイル名はHTTPヘッダ

  • ファイル名の文字コードを変換する

    Windows上で日語のファイル名がついたファイルをzipなどで圧縮すると、Shift_JISのままアーカイブされます。当然圧縮されたzipファイルをubuntuで解凍すると、sjisのまま展開されてしまい、文字化けしたファイル名になってしまうことがあります。 ubuntuでは文字コードがUTF-8なので文字化けしてしまうのですね。 こういう場合はファイル名の文字コード変換ツール convmv を使います。 インストールsudo apt-get install convmvUTF-8に変換する場合$ convmv -r -f sjis -t utf8 * --notest などとする。-r は再帰的。--notest を付けないと実際には変換されない。 ubuntuではjaチームのおかげでいろいろ日語対応なされているのであまり文字化けのケースに出会う機会はないかもしれませんが、イザとい

  • 1