タグ

文字コードに関するCherenkovのブックマーク (11)

  • Unicode一覧表

    Unicode(UTF-8)の文字コード表を出力します。区分名に「*」が付いているものは合成用文字です。 表示: 【使い方】 左肩の区分メニューをクリックすると、その区分にある文字を一覧表で表示します。 一覧表の文字やコード番号をクリックすることで、上記フォームに文字が入力表示されます。 様々な機器で見比べることでフォントの違いを比較することが出来ます。 ブラウザの設定や、OSに組み込まれたフォントの仕様によって表示される文字が異なります。 文字コードを調べたいときは、フォームに文字を入力し、検査ボタンを押してください。 コード表の右上にあるURLをクリックするとURLの後ろに#で始まるハッシュがつきます。そのURLをブックマークすることで、表示の区分を直接開くことが出来ます。 【ご注意】 全コードの出力はかなり大きな表となるため、ブラウザの動作が遅くなったり、動かなくなる場合があります。

  • Sponsors | Unicode AAC

    Sponsors of Adopted Characters As of July 10, 2024, we have 88 Gold sponsors, 108 Silver sponsors, and 1113 Bronze sponsors.

    Sponsors | Unicode AAC
    Cherenkov
    Cherenkov 2016/04/08
    スポンサー
  • 携帯サイトを UTF-8 で作りたくて au ブラウザのバージョンを調べてみた - miauのブログ

    現在構築中のシステム、全体的に文字コードは UTF-8 で統一するつもりだったのですが、携帯電話用のサイトは Shift_JIS で表示する流れになってしまったようで。UTF-8 で統一できると何かと楽なので、携帯電話が UTF-8 に対応してそうか情報を集めてみました。 結論ですが、サイトの特性によるので一概には言えなそうです。 まとまった情報 auブラウザ、いまだにUTF-8が使えず! | 株式会社シンメトリック公式ブログ - 携帯開発から生まれる技術情報 2010-09-09 時点の情報で、見つけた中では一番詳細な比較になっていました。表示が正しく行われているかだけでなく、SSL 対応やパラメータの文字化けについても言及してされています。まとめを抜き出すと、 docomoとSoftBankはUTF-8に完全対応できているが、auは最新ブラウザ(バージョン7.2)ですら完全に対応できて

    Cherenkov
    Cherenkov 2012/03/23
    ガラケー utf-8 shift_jis
  • F-site | [AS3] URLエンコード

    投稿者:野中 文雄 | 投稿日:2007.06.09 | [AS 3][ActionScript][Tips][野中ゼミ] ActionScript 3.0では、escape()関数の動作が2.0/1.0とは一部変わりました。たとえば、"F-siteセミナー"という文字列をescape()関数でURLエンコードすると、ActionScript 3.0と2.0/1.0の結果はそれぞれつぎのような文字列になります。 【ActionScript 3.0】 F-site%u30BB%u30DF%u30CA%u30FC 【ActionScript 2.0/1.0】 F%2Dsite%E3%82%BB%E3%83%9F%E3%83%8A%E3%83%BC 実は、JavaScriptのescape()関数も、Unicodeをサポートするブラウザ上では、ActionScript 3.0と同じ結果を返します

    F-site | [AS3] URLエンコード
    Cherenkov
    Cherenkov 2011/12/24
    url encode escape unescape 日本語 マルチバイト flash.utils.escapeMultiByte()
  • マルチバイトの落とし穴 − @IT

    ブラインドSQLインジェクションも不必要情報の脆弱性も覚えた星野君。だけど覚えないといけないことはまだまだありそうです。今日も赤坂さんといっしょにお勉強。 「はい、これでクロスサイトスクリプティングやってみせて」赤坂さんがそういって見せてくれた勉強用のWebアプリケーション、あれ、見たところ完ぺきなんですが…… 高橋さん 「どうよ?」 星野君 「え……。どうって何がですか?」 高橋さんは唐突に会話を始めることが多い。大抵の場合、星野君には何の話か分からない。 高橋さん 「こないだ赤坂さんとWebアプリの検査したでしょ。どうかなって」 星野君 「どう……っていうか、なんか難しい感じでした。簡単なのはすぐに見つけられると思うんですけど……」 高橋さん 「ふーん……」 高橋さんはしばらく考え込んだ後、赤坂さんに声を掛けた。 高橋さん 「ねぇ、赤坂さん。いまって暇?暇だよねー?」 赤坂さん 「いや

    マルチバイトの落とし穴 − @IT
    Cherenkov
    Cherenkov 2011/11/09
    sjis shift_jis multibyte マルチバイト
  • 文字の情報を調べるためのブックマークレット サロゲートペア対応版 - Ryusei’s Notes (a.k.a. M59のブログ)

    サロゲートペアは大事 元ネタ:文字の情報を調べるためのブックマークレット - IT戦記 サロゲートペアには非対応です>< 文字の情報を調べるためのブックマークレット - IT戦記 おや、これでは音楽記号も算籌も麻雀牌もドミノ牌も線文字Bもヒエログリフも楔形文字もフェニキア文字もチュノムも則天文字も調べられない!! サロゲートペアとは何ぞ サロゲートペア入門:CodeZine(コードジン) UTF-16を使うJavaScriptでは扱いが難しくなるから、文字単位で処理しようとする時につまずく。Unicodeには他にも《結合文字の並び》という落とし穴があるけどね。 ブックマークレット サロゲートペア対応版 javascript:location.href = 'http://www.fileformat.info/info/unicode/char/' + (function(r){ var

    文字の情報を調べるためのブックマークレット サロゲートペア対応版 - Ryusei’s Notes (a.k.a. M59のブログ)
    Cherenkov
    Cherenkov 2011/07/03
    location.href=じゃなくてopenに変えた。
  • [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ!

    ウノウラボ Unoh Labs: PHPのちょっとしたコツ  最近のスクリプト言語は機能が多く、基的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね(コーディングの効率的にも)。  自分にもそういったレベルで気をつけていることがいくつかあります。 -[早起き生活]PHPのパフォーマンスチューニング -[早起き生活]PHPのパフォーマンスチューニング その2:count()も使い過ぎると重くなる -[早起き生活]PHPのパフォーマンスチューニング その3:APC投入  あと、最近気づいたTIPSとしては、 日語を正規表現検索したいときでもereg系の関数を使うのはやめとけ なんてのもあります。  PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系

    Cherenkov
    Cherenkov 2011/04/22
    UTF-8な日本語に正規表現を使う場合は\uオプション必須。
  • エンコードマニアックス - 各種エンコードやハッシュを一発作成

    SHA-256 e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855 SHA-384 38b060a751ac96384cd9327eb1b1e36a21fdb71114be07434c0cc7bf63f6e1da274edebfe76f65fbd51ad2f14898b95b SHA-512 cf83e1357eefb8bdf1542850d66d8007d620e4050b5715dc83f4a921d36ce9ce47d0d13c5d85f2b0ff8318d2877eec2f63b931bd47417a81a538327af927da3e

  • たむら::日本語文字コードの自動判定

    Ruby による日語文字コード判別ライブラリの比較 してみた。いいづからぐのネタです :-) そもそも nkf の utf-8対応版が出た。 簡単に NKFモジュールに対応出来るんじゃ む。nkf自体には文字コード判別のルーチンって独立してないんだ NKF.guess って nkfとは関係ないルーチンじゃん 現状の判別ライブラリたち NKF.guess(rb_nkf_guess) もともとの NKFモジュールの実装。 関数のコメント。 /* * Character code detection - Algorithm described in: * Ken Lunde. `Understanding Japanese Information Processing' * Sebastopol, CA: O'Reilly & Associates. */ 最大の問題点は、EUC,SJIS,J

    Cherenkov
    Cherenkov 2010/11/29
    マルチバイト文字 全角 判定 日本語
  • Windows-31J 情報

    IANA の登録名が Windows-31J となっている Windows Codepage 932 についての情報を、ごく簡単にではありますが、まとめてみました。 Windows-31J の文字セット 2003年8月21日 更新 Windows-31J の重複符号化文字と Unicode ( Windows-31J版 ) eucJP-ms ホーム > Windows-31J 情報

  • Shitf_JISとCP932とMS932とWindows-31Jを昔話風に語ってみた - 凶悪モナド

    要約すると こんな感じ Shift_JIS ≒ CP932 = Windows-31J = MS932 こういう言い方もできる 仕様:Shift_JIS 実装:CP932, Windows-31J Javaでのみ使われる都合上の名前 別名:MS932 編 むかしむかし、あるところに「Shift_JIS」という名の文字エンコーディングがおったそうな。里の村長「マイクロソフトたん」はいち早くShift_JISの才に目をつけた。マイクロソフトたんはShift_JISを育てることにし、愛称として『コードページ932(CP932)』と呼んでおったそうな。それからまもなくして、Shift_JISはMS-DOSというOSにのせて売られはじめるようになったんじゃ。 同じ里の「IBMたん」はそのMS-DOSをつかってマルチステーション5550というパソコンをこしらえた。IBMたんはもっと便利になるようにと

    Shitf_JISとCP932とMS932とWindows-31Jを昔話風に語ってみた - 凶悪モナド
    Cherenkov
    Cherenkov 2010/07/19
    encode decode Shift_JIS ≒ CP932 = Windows-31J = MS932
  • 1