[B! 文字コード] closerのブックマーク

波ダッシュ Unicodeに関連する問題 - Wikipedia

波ダッシュ（なみダッシュ、wave dash[注釈 1]）とは、日本語表記における約物のひとつで、波線「」（はせん、なみせん）を指している。ダッシュ記号（—）の波形であることからそう呼ばれる[注釈 2]。日本語における用法の多くはダッシュ記号としての用法と長音符としての用法であり、中国語でも長音符などとして使われることがある。 Windows XP等における日本語環境下では、表示字形が「」ではなく、波形の反転した「」に変わってしまう問題が発生していた[注釈 3]。これに付随して、波ダッシュの代用として音声記号等として用いられる全角チルダが不適切に使われることがあるため、混乱の元となっている[1][注釈 4]。波ダッシュは、範囲を表すために用いられる[注釈 5]。場所に対して: 東京〜大阪時間に対して: 5時〜6時（もしくは5〜6時）数量に対して: 100人〜150人（もしくは10

closer 2009/04/07

リンク

htmlspecialchars/htmlentitiesの正しい使い方

(Last Updated On: )追記：このエントリは古い情報です。今のHTMLエスケープの情報は以下の新しいエントリを参照してください。 PHPのHTMLエスケープ PHP_SELFはそのまま出力できないに htmspecialchars($str, ENT_QUOTES); じゃなくて、 htmspecialchars($str); で終わらせてしまった場合の、問題例が非常に欲しいです！！とコメントを頂きました。 htmlspecialcharsとhtmlenties関数はENT_QUOTESを指定しないとENT_COMPAT（セキュリティ上問題があるが互換性を維持）が指定された状態と同じ動作をします。 ENT_QUOTESは”と’の両方をHTMLエンティティに変換するオプションです。ENT_COMPATは”のみHTMLエンティティに変換します。 JavaScript/HTML

closer 2008/11/06

リンク

ＣＧＩで特定の文字（表・予・申・能など）が文字化けする

・ＣＧＩで特定の文字（表・予・申・能など）が文字化けする自動バックアップ・テスサーバー付きの新機能スマートリリース CGIやPHPなどの技術系でSuper FAQ（よくある質問）がこれです。下記のような文字化けが発生します。文字化けしている漢字は「表」「予」「申」「能」「十」「ソ」などです。第１章の「Netscape4.Xのdocument.write時の文字化け」は音が「シ」のものに集中的に文字化けが見られるなど、顕著な規則性がありました。今回の文字化けは、「音」が似通っているという特色はありません。しかし、それぞれの漢字のShift_JISコードを調べてみると、ある規則性が浮かび上がってきます。Shift_JISコードを調べるには、序論で紹介したようなIMEやことえりの文字一覧表でもいいのですが、ここではURLエンコードを利用してみます。 URLエンコードは、プログラマーでない方

closer 2008/11/06

リンク

Microsoftコードページ932 - Wikipedia

Template‐ノート:特殊文字に、このページに関する質問があります。（2023年1月）質問の要約：Template:特殊文字で「Microsoftコードページ932（はしご高）」と書かれている場合があることこの記事には複数の問題があります。改善やノートページでの議論にご協力ください。出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。（2011年11月）出典は脚注などを用いて記述と関連付けてください。（2011年11月）出典検索?: "Microsoftコードページ932" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL MS932とその他の日本語に関連した文字集合との関係オイラー図 Microsoft コードページ 932（マイクロソフトコードページ 932

closer 2008/09/10

文字コード

リンク

JavaScript++かも日記 - 1997年からの

Testnetがアップデートされたのは知ってたけれど、libra-authのデモも動かなくなったのでちょっと調…

closer 2006/08/20

リンク

■UTFとは何か■

最近unicodeに対応したソフトが増加してくるにつれ、用語の混乱も一部には見られるようになってきました。そこで特に触れることの多い、UTF-7,UTF-8,UTF-16 についてここで少し取り上げておきたいと思います。 UnicodeとUCS UnicodeはThe Unicode Consortiumが定めた文字コードの規格である。UCSはISOとIECが共同で制定したもので、ISO/IEC 10646 の規格番号が付いている。両者は大雑把にいえば同じものと考えてもよいのだが、違う機関が定めたものである故に、微妙に(?)差があるのも事実である。 ■Unicode側の改訂経緯 Unicode1.0(1991) アメリカの技術者を中心に作られ、漢字コードは極めてデタラメ Unicode1.1(1993) 中国の技術者が加わり、少しはまともになる。日本が猛反発。 Unicode2.0(199

closer 2006/06/30

文字コード

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

文字コードに関するcloserのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

【復旧済】はてなブックマークへの接続ができない・不安定になる障害が発生していました

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス