[B! 文字コード] webmarksjpのブックマーク

webmarksjp id:webmarksjp

文字コードに関するwebmarksjpのブックマーク (66)

それ Unicode で
UTF-7 を使ってスクリプトを記述 +ADw-SCRIPT+AD4-alert(\'XSS\');+ADw-+AC8-SCRIPT+AD4- IE は、文字エンコーディングが不明で UTF-7 っぽい文字列があれば、自動判別で UTF-7 となる。
webmarksjp 2008/07/15
security

も-文字コード

charcode

文字コード

脆弱性

これはすごい

まとめ

xss

セキュリティ
リンク
エンコードマニアックス - 各種エンコードやハッシュを一発作成
JavaScript encodeURIComponent() UTF-8限定 /home/akiyan/encodemaniax/webroot/index.html on line 70 "> Warning: Undefined array key "js_encodeuricomponent" in /home/akiyan/encodemaniax/webroot/index.html on line 71 JavaScript encodeURI() UTF-8限定 /home/akiyan/encodemaniax/webroot/index.html on line 70 "> Warning: Undefined array key "js_encodeuri" in /home/akiyan/encodemaniax/webroot/index.html on line
webmarksjp 2008/07/15
webサービス

ツール

プログラミング

character-code

webService

html

php

JavaScript

文字コード
リンク
文字コード規格の基礎：ITpro
この記事は，日経ソフトウエア 1999年10月号に掲載したものです。それ以降の情報が盛り込まれていませんので，現在とは異なる場合があります。文字コード規格の基礎を手早く理解したい場合などにお役立てください。文字コードは間違いなく情報を交換するための「決まりごと」なので，正確を期すため厳密な仕様が規定されている。だが，その仕様そのものを実装するプログラムを作る場合を除けば，プログラマが仕様の詳細を隅々まで理解している必要はない。六法全書を読んでいなくても問題なく普段の生活ができるようなものだ。ここでは，通常のプログラミングをするうえで必要と思われる範囲のことを，なるべく簡潔に説明したい。「半角カナ」のような呼び名は正確さを欠くものだが，多くの人に伝わりやすいので説明の中でも使っていく。説明を簡略化するため「正確な仕様を知りたいときは規格書そのものを必ず参照してほしい」と書きたいところだ
webmarksjp 2008/07/15
92 CHARSET

あとで読む

,技術

文字コード

itpro

*programming

プログラム

プログラミング
リンク
404 NOT FOUND | Kagayaku
瀧本美織の整形疑惑に終止符！画像40枚の検証でわかったデビューから2022年までの目元や鼻すじの変化を徹底考察
webmarksjp 2008/07/15
php

文字化け

文字コード

多言語

charset

encode

mbstring
リンク
シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories
2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。変換表に求めら
webmarksjp 2008/07/14
開発

charset

資料

文字コード

*tips

まとめ

プログラム

変換

文字化け
リンク
Vistaで化ける字，化けない字
11月30日に企業向けには出荷が始まったWindows Vista。そのVistaで，“文字化け”が起こるらしい。文字化けといっても，Webアクセス中にたまに見かける全く読めない文字の羅列になることはほとんどなく，その多くは似た文字が表示される程度である。ここでは，本来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う。 Microsoftは，Windows 98日本語版の発売以来，Windows 2000，Windows Me，Windows XPまでCP932（本名はWindows Codepage 932，いわゆるMS漢字コード）とJIS X 0212をサポートしてきたが，最新のWindows VistaではJIS X 0213に乗り換えた。いや，乗り換えたというのは，ちょっと語弊がある。CP932とJIS X 0212に加えて，JIS X 0213もサ
webmarksjp 2008/07/14
62 FONT

®Windows

92 CHARSET

®Vista

文字コード

開発

os

text

vista

文字化け
リンク
RTFM
ドキュメントを読まない輩結論: ぐぐるな。ドキュメントに書いてあるとわかっているのになぜ google に頼る? 巷間でよく見られる、しかし Apache の配布アーカイブ一式に含まれているドキュメントをちゃんと読んでいれば起きないはずの設定ミスや、ミスではないがふしぎな設定について。 <Limit>: セキュリティ上のリスクがあるのですみやかに確認・修正されたし AddDefaultCharset: 穴ではないが修正が必要 LanguagePriority: ほとんどのサイトでは無意味 ScriptAlias: 管理者でなくエンドユーザがハマるのはしかたないけれど SetEnvIf: どこも間違ってはいないのだが… Apache のドキュメントは日本語未訳なところが一部残っているけれど、全体として非常によくまとまった情報源である。少なくとも、「このディレクティブをどう設定するとどう動く
webmarksjp 2008/07/14
linux

apache

security

設定

ajax

文字コード

tips

google

サーバ
リンク
Escape Codec Library: ecl.js
日頃より楽天のサービスをご利用いただきましてありがとうございます。サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。メンテナンスが終了次第、サービスを復旧いたしますので、今しばらくお待ちいただけますよう、お願い申し上げます。
webmarksjp 2008/07/14
ライブラリ

javascript

dev

エンコード

library

文字コード
リンク
すべての漢字を取り出す正規表現 - totonのブログ
http://www.unixuser.org/~euske/doc/python/sample.py.html # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html ［亜-煕］はJIS漢字を検出するときに使う正規表現になります。本文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので，すべての漢字を検出するには，[一-龠]を使用してください（龠は音読みで「ヤク」，訓読みで「ふえ」，Unicodeでは「9FA0」にあたります）。追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。
webmarksjp 2008/07/14
perl

python

ruby

形態素解析

文字コード

正規表現

Programming
リンク
UTF8 フラグあれこれ - daily dayflower
UTF8 フラグについてわかってるつもりだったんですが，utf8::is_utf8 considered harmful - Bulknews::Subtech - subtech を読んで混乱したので，自分なりにまとめてみました。間違いがありましたらご指摘よろしく。まとめスカラー変数の内部表象の状態を示すものとして UTF8 フラグというものがあるスカラー変数は（リファレンス等は別として）下記のものを格納できる (A) 文字列（内部表象: UTF-8） (B) 文字列（内部表象: ISO-8859-1） (C) バイナリ列純粋なバイナリストリーム（画像ファイル等）かもしれないし， UTF-8 octet stream かもしれないし， CP932 octet stream かもしれないし，etc, etc ... Perl は（後方互換性確保などの理由から）ISO-8859-1
webmarksjp 2008/07/14
utf8

Perl

encode

UTF-8

文字コード

utf8フラグ
リンク
「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う:phpspot開発日誌
Information Flow and Stock: [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ！なので、できる限りpreg系の関数を使いたいわけですが、検索対象や検索パターンに日本語が含まれているときは、日本語処理に対応したereg系の関数であるmb_ereg系の関数が使われることが多いようです。以前、「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う方法。以前はmb_eregによる方法を示しましたが、次の方法の方がうまく動作するようです。 preg_match_all('/[一-龠]+|[ぁ-ん]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[ａ-ｚＡ-Ｚ０-９]+/u', $strToSplit, $aMatches); print_r($aMatches); // マッチ結果が全出力確かに、なぜか取れない漢字があ
webmarksjp 2008/07/14
php

正規表現

文字コード

プログラミング

これはすごい

*PC

漢字
リンク
ウェブマスターのための文字化け講座
（序論）文字化けの発生メカニズム概論と解析方法ネスケ4.Xで特定の文字（試・時・事・私など）が文字化けする場合 → document.writeで文字化けする漢字の規則性 → ネットスケープ4.Xのキャッシュ機構 → ２種類の解決方法ＣＧＩで特定の文字（表・予・申・能・ソ・十など）が文字化けする → Shift_JISでCGIを作成する場合の注意点 → PHPで「表\示」「十\和田湖」「申\し込み」などと表示される場合「（はしご高）」が使えない理由 → Windowsでは表示されるが、Macでは文字化けする文字 → Macでは表示されるが、Windowsでは文字化けする文字 → 機種依存文字チェック・プログラム（Flashフォームなど）文字化けしないための工夫 → メタタグの指定は有効か？ → 「美乳」で文字化けが直るって本当？フォントを指定したら文字化けした。 → フォントの指
webmarksjp 2008/07/14
*まとめ

html

文字コード

文字化け

PC

後で読む

サイト制作

webデザイン
リンク
Vistaで化ける字，化けない字（続報）
前報で述べた通り，マイクロソフトのWindows Vistaでは，文字コードにUnicodeを使いながら，Unicodeとは異なる文字コード規格のJIS X 0213をサポートする，という方式を取っている。というのも，Windows 98日本語版以降ずっとサポートしてきたCP932（本名はWindows Codepage 932，いわゆるMS 漢字コード）やJIS X 0212を捨てるわけにはいかないので，CP932もJIS X 0212もJIS X 0213もみんなまとめてUnicodeで扱う，というやり方を取らざるをえないのである。前報では，JIS X 0213の第一水準～第三水準漢字7614字について，Vistaで新たに採用された日本語フォントセットであるメイリオとXP以前のMSゴシックを見比べ，7614字のうち325字*が，VistaとXP以前との間で文字化けする（ここでは本来表
webmarksjp 2008/07/14
®Windows

92 CHARSET

®Vista

開発

文字コード

windows

vista

技術

font
リンク
‘愛’で学ぶ文字コードと文字化けの常識　(1/4) - ＠IT
本連載は、Java言語やその文法は一通り理解しているが、「プログラマー」としては初心者、という方を対象とします。Javaコアパッケージを掘り下げることにより「プログラマーの常識」を身に付けられるように話を進めていきます。今回は、文字コードや文字化けについて。OSや携帯電話の機種の違い、メール、Webブラウザ、DB入出力、国の違いなどさまざま原因で起きる文字化けを徹底解説！文字コードや文字化けの知識はプログラマーの常識今回は、文字コードや文字化けなどの文字に関する常識をJavaを通して身に付けていきます。私たちプログラマーにとって、文字や文字列を扱うことはとてもありふれたことです。ほとんどのプログラムにおいて、何らかの形で文字や文字列を扱っていることでしょう。インターネット時代には必須の知識コンピュータ1台で動作するプログラムを扱っている範囲では、皆さんは特に何の困難に出合うことも
webmarksjp 2008/07/14
あとで

92 CHARSET

*programming

プログラミング

文字化け

java

*あとで読む

文字コード
リンク
特番　Windows Vistaの新文字セットが引き起こすトラブル：ITpro
【記者の眼】 Unicodeは「使える」から「知らずに使う」フェーズへ　Windowsにおいて「Unicode」は，長らく「使える」けれども「あまり使われない」存在だった。その状況が「Windows Vista」と「the 2007 Microsoft Office」で変わろうとしている。この2製品に付属する「Microsoft IME」で，「WindowsではUnicodeでしか扱えない文字」が，変換候補として頻出するようになったからだ。Unicodeはいよいよ，一般ユーザーが「知らずに使う」存在になるだろう。【記者のつぶやき】シフトJISを捨てられるか? これまで，Windows Vistaの文字の扱いに関する事柄を何度か取り上げてきた。同じキャラクタ・コードで，Windows XPのときと文字の形が変わったり，Unicodeでしか扱えない文字があったりするという話題だ。今
webmarksjp 2008/07/14
vista

®Windows

92 CHARSET

®Vista

encoding

PC

文字コード

あとで読む

windows
リンク
yohgaki's blog - これからのプログラムの作り方 - 文字エンコーディング検証は必須
Last Updated on: 2016年3月3日最近PostgreSQL、MySQL両方にSJISエンコーディングを利用している際のエスケープ方法の問題を修正がリリースされています。この件は単純に「データベースシステムにセキュリティ上の脆弱性があった」と言う問題ではなく「アプリケーションの作り方を変える必要性」を提起した問題です。参考：セキュアなアプリケーションのアーキテクチャ – sandbox化 PostgreSQL、MySQLの脆弱性は特にSJIS等、マルチバイト文字に\が含まれる文字エンコーディングが大きな影響を受けますが、同類の不正な文字エンコーディングを利用した攻撃方法が他の文字エンコーディングでも可能です。例えば、UTF-8エンコーディングは1文字を構成するバイト列の最初のバイトの何ビット目までが1であるか、を取得してUTF-8文字として1バイト～6バイト必要なのかわか
webmarksjp 2008/07/14
Programming

PHP

MySQL

PostgreSQL

文字コード

security

DB-DB設計

セキュリティ
リンク
HTMLの特殊文字： IT用語辞典
IT用語辞典 e-Words（イーワーズ）とは … IT（情報技術）用語のオンライン辞典です。情報、通信、コンピュータなどに関連する各分野の用語について、キーワード検索や五十音索引から調べることができます。用語の意味や定義、概要や要約、略語や別表記、英語表記や綴り、フルスペル、読み方や発音、仕組みや役割、歴史や由来、語源、構造や構成、要素、特徴や機能、性能、規格や仕様、標準、原因や要因、手法や方法、方式、種類や分類、利点や欠点、問題点、対義語や類義語との違い、用例や事例、具体例などを分かりやすく解説することを目指しています。関連する画像や図表、関連用語、外部資料や別の辞典による解説へのリンクなども掲載しています。
webmarksjp 2008/07/14
webtech

webdesign

特殊文字

web

tips

お役立ち

webデザイン

browser

文字コード
リンク
高木浩光＠自宅の日記 - はてなブックマークを禁止する技術的方法, 追記, 追記2 （23日）
■ はてなブックマークを禁止する技術的方法ある属性を持つ人々にとって、はてなブックマークは、必要な情報源を巡回するための効率的なツールとなっている。もはや「はてブ」されない記事は存在しないのも同然となってしまている人もいるかもしれない。ソーシャルブックマークサービスはなにも「はてな」だけではないのだが、事実上「はてな」が独占状態にあり（少なくとも一部の分野においては）、「はてなブックマーク」でないと情報源となり得ない状況になっている。この状況はアーキテクチャ的に望ましい状態ではないと思うが、しかたない。そういう中で一つ問題がある。情報セキュリティの話題を追いかけるには「セキュリティ」タグを見ていればよいわけだが、ここに「JVN」のエントリが出てこない。 JVNの認知度が高まらないのにはいろいろな要因があって、JVNのサイトデザインが最悪だ（ユーザビリティを何も考えていない）という問題も
webmarksjp 2008/07/14
hatebu

hatena

sbm

encode

はてな

url

文字コード

WebAppSec

あとで読む
リンク
ウノウラボ Unoh Labs: 日本語とPHP
GT Nitro: Car Game Drag Raceは、典型的なカーゲームではありません。これはスピード、パワー、スキル全開のカーレースゲームです。ブレーキは忘れて、これはドラッグレース、ベイビー！古典的なクラシックから未来的なビーストまで、最もクールで速い車とカーレースできます。スティックシフトをマスターし、ニトロを賢く使って競争を打ち破る必要があります。このカーレースゲームはそのリアルな物理学と素晴らしいグラフィックスであなたの心を爆発させます。これまでプレイしたことのないようなものです。 GT Nitroは、リフレックスとタイミングを試すカーレースゲームです。正しい瞬間にギアをシフトし、ガスを思い切り踏む必要があります。また、大物たちと競いつつ、車のチューニングとアップグレードも行わなければなりません。世界中で最高のドライバーと車とカーレースに挑むことになり、ドラッグレースの王冠
webmarksjp 2008/07/14
PHP

iconv

文字コード

language

code

mb_string

ini
リンク
「私のために争わないで」文字コードのUTF8さん、自殺 - bogusnews
文字コード・エンコーディング体系として知られるUnicode UTF8さん（9歳）が11日、都内で自殺していたことがわかった。関係者によれば、このところ周囲で論争や誹謗中傷が絶えないのを苦にふさぎこむことが多かったという。葬儀は故人の遺志により密葬となる予定。 UTF8さんはエリートで有名なUnicode家の末妹。ここ数年、「I18Nでラクできる」「なんかカッコイイ」と勘違いしたプログラマのあいだで採用が進んだことから華やかなセレブ生活を送っていたが、カネ（特に円）に弱い波打ちぎわをダッシュすると右左もわからなくなる低脳天然キャラの演出のつもりか、いつもデカい辞書を抱えていてウザい実の親ではなく、サロゲート夫婦に産んでもらったらしい古いワーキングブラウザに冷たい、格差社会の象徴などの批判や中傷にさらされるようになり、最近は落ち込みがちに。親しかったBOMさんによれば心療内科に通
webmarksjp 2008/07/14
programming

ネタ

*雑学

*IT

*あとで読む

*プログラミング

文字コード
リンク
1 2 3 4 次のページ