タグ

encodingに関するreptamのブックマーク (9)

  • dzeta.jp技術資料 - Apacheと日本語ファイル名と%

    Apacheで日語のファイル名を取り扱うにはmod_encodingを入れればよい。mod_encodingはOSネイティブなエンコーディングでファイル名を送ってくるWebDAVクライアント用に作成されたモジュールだが副作用として日語を含むURLを適切に処理できるようにしてくれたりする。 設定方法としては、httpd.confとかに <IfModule mod_encoding.c> EncodingEngine on SetServerEncoding SJIS ClientEncodingの設定 </IfModule> と書けばよい。こうするとWebDAVに害が出そうな気がするのだが見た感じ問題ないようだ。 一方、mod_encodingを入れるとCGIパラメータとかも変換してしまうのでいろいろ害があるらしい。それへの対策パッチは提供されている。Apache1.3のパッチとApac

    reptam
    reptam 2012/01/02
    mod_encoding
  • UTF-8.jp

    - WinMirror - 任意のアプリケーションのウィンドウやデスクトップをミラーリングして表示できます。 解説: オンサイトでの登壇で返しのモニターがなくてもデモをやりやすくするツールを作った - SSTエンジニアブログ - 音声字幕機能付きのWebカメラ - Web Audio APIを使ってマイク入力をスピーカーから出力 - LTタイマー - JavaScriptセキュリティの基礎知識:連載|gihyo.jp … 技術評論社 - HTML5時代の「新しいセキュリティ・エチケット」- @IT - 教科書に載らないWebアプリケーションセキュリティ - @IT - 連載:当は怖い文字コードの話|gihyo.jp … 技術評論社 - JSF*ck - encode JavaScript with only 6 letters - []()!+ (broken) JSF*ck demo

  • バイト型配列のデータを文字コードを指定して文字列に変換 .NET Tips C#, VB.NET, Visual Studio

    バイト型配列のデータを文字コードを指定して文字列に変換する 文字列を文字コードを指定してバイト型配列のデータに変換するバイト型配列を文字列に変換するバイト型配列に代入されている文字列データをString型に変換(デコード)するには、Encoding.GetStringメソッドを使います。具体的には、バイト型配列のデータの文字コードに従ってEncodingオブジェクトを作成し、GetStringメソッドを呼び出します。Encodingオブジェクトを作成する方法については、「目的の文字コードに合ったEncodingオブジェクトを取得する」をご覧ください。 下の例ではバイト型配列"bytesData"にすでに文字列データが入っているものとし、これをString型に変換しています。 'バイト型配列"bytesData"に文字列データが入っているものとする Dim str As String 'Sh

    バイト型配列のデータを文字コードを指定して文字列に変換 .NET Tips C#, VB.NET, Visual Studio
  • ISO/IEC 8859-1 - Wikipedia

    ISO 8859-1(より正式にはISO/IEC 8859-1)はISO/IEC 8859の第一部であり、ラテンアルファベットの文字コード標準である。よりくだけた言い方ではLatin-1と呼ばれる。最初はISOによって開発されたが、後にISOとIECによって合同で保守されている。この標準に追加の文字を(16進符号0x00-0x1Fの「C0領域」と、0x80-0x9F「C1領域」の範囲に)割り当てたものは、2つの広く使われているキャラクタセットの基となる。ISO-8859-1(余分なハイフンに注意)とWindows-1252と呼ばれるものである。 2004年6月、8ビット符号化文字集合の整備を担当するISO/IECの作業部会は、国際符号化文字集合 (UCS) とUnicodeの開発に専念するために解散し、ISO 8859-1を含むすべてのISO 8859の整備を中止した。コンピュータアプリケ

  • Shift_JIS文字を含むソースコードをgccでコンパイル後、警告メッセージが表示される

  • UCS-2とUTF-8

    最終更新 2003-11-11 UCSとUTF ユニコードで文書を作るとき,文字コードの方式が2種類,あるいはそれ以上あることに気が付かれるかもしれません。例えば,一つはUnicodeとあるのに対し,もう一つはUnicode (UTF-8)と表記されているかもしれません。この2つは,また,その違いは何でしょうか(前者はUTF-16の一形態なのですが…)。 UCS-2とUCS-4 ユニコードが採択されることになった多言語用の文字コードセット,ISO-10846-1は,16ビット(16桁の二進数)でそれぞれの文字を表します。それをUCS-2 (Universal Character Set coded in 2 octets,「2つのオクテットでコードされたユニバーサル文字セット」)と称します。オクテットとは文字長の単位としての8ビット(8桁の二進数)のことです。 ユニコードの特定の文字は,例

  • Punycode - Wikipedia

    Punycode(ピュニコード、プニコード)とは、国際化ドメイン名で使われる文字符号化方式で、RFC 3492 で定義されている。Unicode で書かれた文字列をDNSで使用可能な、アルファベット(大文字小文字を区別しない)、数字、ハイフンのみの文字列に変換する。 ドメイン名として Punycode を使用する際は、ピリオド(.)で区切られたドメイン名の階層レベルごとにプレフィックスとして「xn--」を使用し、エンコードされた文字列を続ける。大文字と小文字は区別されない。 可読なドメイン名 Punycodeでのドメイン名

  • Perl 5.8.x Unicode関連

    -> 趣旨と注意書き -> UTF8フラグ? -> UTF8フラグとPerlIOレイヤ -> UTF8フラグのついた文字列を記述する -> Wide character in print ... -> Encode -> utf8::* -> use utf8; -> use encoding; -> use UTF8 と use encoding -> JcodeからEncodeへ -> 情報源 <- モドル 趣旨と注意書き Perl 5.8.x のUnicode 関連です。 正直、5.8.x は、ネタでしか使ってなかったので(ぉ、ちゃんといじったことがありませんでした。 使ってみると、よくわかんなくなったので、ちょっとまとめてみました。 今でもあんまりわかってないかもしれないので、内容は無保証です。 突っ込み歓迎。 Jcode、Encodeのメンテナの弾さんから、ご指摘いただいたので、

  • Perl/日本語処理 - Wikibooks

    utf8プラグマを使用すると、ソースコードがUTF-8であると仮定され、文字列にutf8フラグが立つようになります。また様々な関数や演算子はバイト単位ではなく文字単位で動作するようになります。

  • 1