タグ

文字コードに関するtaloのブックマーク (6)

  • ウノウラボ Unoh Labs: Mac OS X上のUnicode

    Firefoxは内部的に変換処理を行うようになっているようです。 問題はSafariとOperaですね。 選択されたファイルのパスからJavaScriptで ファイル名を抜き出してタイトルに設定する部分で、 正しく扱えるような文字コードに変換することにしたいと思います。 基的な流れとしては、UTF-8-MAC特有の「U+3099」(COMBINING KATAKANA-HIRAGANA VOICED SOUND MARK)、 「U+309A」(COMBINING KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK)がファイル名に含まれている場合は、 その前の文字と結合して濁音・半濁音の文字にしてあげればいいでしょう (ひらがな・カタカナのみの暫定的な対処に過ぎませんが)。 変換用の文字テーブルを用意して、逐一変換していくかたちにしたいと思います。 というわけ

  • HTMLエンティティ化

    HTMLエンティティ化 version Japanese 1.0(説明) エンティティ化するテキスト mailto:someone@some.domain.com エンティティ化されたテキスト オプション 入力文の半角スペース、タブ、改行を除去する エンティティ化する・しない文字を無作為に選ぶ(チェックしないときは全てエンティティ化) 但し、以下の文字は必ずエンティティ化する: エンティティ出力形式: 注1 説明 ホームページに公開するメールアドレスなどを広告業者に収集されるのを防止するためのソフトウエアです。WWWページに記載するメールアドレスなどをこのプログラムでエンティティコード(数値文字実体参照)に変換して書き換えてやれば、WWWページを実際に見ている人間には支障を与えることなく、メールアドレスなどが自動収集プログラムなどから見つかり難くなります。 使い方 変換したいメールアドレス

  • マルチバイトの落とし穴 − @IT

    ブラインドSQLインジェクションも不必要情報の脆弱性も覚えた星野君。だけど覚えないといけないことはまだまだありそうです。今日も赤坂さんといっしょにお勉強。 「はい、これでクロスサイトスクリプティングやってみせて」赤坂さんがそういって見せてくれた勉強用のWebアプリケーション、あれ、見たところ完ぺきなんですが…… 高橋さん 「どうよ?」 星野君 「え……。どうって何がですか?」 高橋さんは唐突に会話を始めることが多い。大抵の場合、星野君には何の話か分からない。 高橋さん 「こないだ赤坂さんとWebアプリの検査したでしょ。どうかなって」 星野君 「どう……っていうか、なんか難しい感じでした。簡単なのはすぐに見つけられると思うんですけど……」 高橋さん 「ふーん……」 高橋さんはしばらく考え込んだ後、赤坂さんに声を掛けた。 高橋さん 「ねぇ、赤坂さん。いまって暇?暇だよねー?」 赤坂さん 「いや

    マルチバイトの落とし穴 − @IT
  • ひ日誌 - UTF-8 で行こう , 写真は光速コミュニケーション言語

    _ UTF-8 で行こう 実装がどうとか気にしない純粋なユーザとしてflickrをやっていると、いろんな言語が当たり前のように混在していることに気付く。ネタや絵文字として日の文字を使ってる人もいるし、英語ドイツ語と日語と中国語のコメントが同時についていたりみたいな… そういう状況に馴染んでみて、インターネットアプリは UTF-8 メインにしなきゃだめだなと思った。もちろんターゲットとするドメインとか状況によって臨機応変になるべきだけど。自分にとってはいろんな言語入り乱れの世界がおもしろい。今頃気付いてるようなことじゃないな… _ 写真は光速コミュニケーション言語 flickrの場合、英語は第二公用語にすぎず、一番重要なコミュニケーション言語は写真。これは視覚が機能していれば誰でも使える。伝えたい情報の内容や量や種類や表現力次第ではあるけど、条件さえそろえば基的に光の速度で伝わっちゃ

  • Escape Codec Library: ecl.js

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • アスキーコード表

  • 1