タグ

2010年6月18日のブックマーク (4件)

  • 第33回 enc2xs:標準の文字コード表にはない文字を変換する | gihyo.jp

    Encodeを使っても文字化けするとき Encodeは特定のエンコーディングにしたがって配列されたバイナリを「文字列」に置き換えるためのモジュールですが、かならずしもすべてのエンコーディングがあらゆるバイナリの組み合わせに対応しているわけではありません。 たとえば、「⁠シフトJIS」環境における機種依存文字の例としてよく取り上げられる丸付き数字をEncodeのお作法通りにdecode、encodeする場合、「⁠シフトJIS」だからと思って安易にshiftjis系列のエンコーディングでdecodeしてしまうと、丸付き数字のマッピングデータがないため「?@」のように文字化けを起こしてしまいます。 use strict; use warnings; use Encode; my $binary = pack('C*', 0x87, 0x40); # ①; my $string = decode(

    第33回 enc2xs:標準の文字コード表にはない文字を変換する | gihyo.jp
    masasuz
    masasuz 2010/06/18
  • 第3回 様々なデータ型を扱えるTokyoTyrant | gihyo.jp

    どんなところに使える? もっとも簡単な利用方法は、前回紹介したmemcachedの代替として利用するというものです。memcached互換プロトコルが実装されているため、memcachedを利用している場合ポート番号を変えるだけでTokyoTyrantに差し替えることが可能です。これだけで簡単にデータの永続性が得られます。 また、テーブルデータベースを利用すれば一つのkeyに対して複数のvalueを持たせることが可能であり、keyだけでなく任意のvalueを条件としてデータの検索を行うこともできます。JOINやGROUP BYといった処理は行えませんが、それ以外のほとんどの検索条件を扱えます。レスポンスはRDBMSに比べて高速なので、アクセス数が多いテーブルをTokyoTyrantのテーブルデータベースに載せ換える、といった利用方法も効果的かもしれません。 具体的な利用シーン memcac

    第3回 様々なデータ型を扱えるTokyoTyrant | gihyo.jp
  • 【 nkf 】 文字コードを変換する

    0x80-0xfeのコードをISO-8859-1 (Latin-1)として扱う。ただし,JISコードの時のみ有効

    【 nkf 】 文字コードを変換する
  • ファイルの文字コード、フォーマットを指定して、読み直す。 — 名無しのvim使い

    vimエディタでテキストファイルを開いた時に、 ファイルのエンコーディングや改行を正しく解釈できない場合があります。 この記事では、そのような場合のファイルの読み直し方について説明します。 この機能は、他のエディタの「文字コードを指定して読み直す」「改行コードを指定して読み直す」 の機能にあたります。 (Windows, Mac) 概要 vimエディタでテキストファイルを開いた時に、 ファイルのエンコーディングや改行を正しく解釈できない場合があります。 この記事では、そのような場合のファイルの読み直し方について説明します。 この機能は、他のエディタの「文字コードを指定して読み直す」「改行コードを指定して読み直す」 の機能にあたります。 (機能の名称はエディタによって異なるでしょう)