タグ

charsetに関するsiroccoのブックマーク (8)

  • あんのたんのブログ : 2種類の「濁点付き全角カナ」 - livedoor Blog(ブログ)

    2008年09月11日14:33 カテゴリ未分類 2種類の「濁点付き全角カナ」 ブログネタ:Macな話題 に参加中! とある日のこと、iWebで、”キーバインド.html”の内容を更新しようとした。 iWebでフォルダに公開したあとCyberDuckでアップロードすると…、あれ? 古い"キーバインド.html"が残ったまま、新しい"キーバインド.html"ができてしまった。 Webブラウザからアクセスしてみると、 古いページが表示される。 古いページをFTPで削除すると、今度はNot Found. 試しにキーバインドhtmlのファイル名を別のものに変えた後、キーバインド.htmlに手打ちで変更すると、ブラウザで表示できた。 なんでだ…と思いつつ暫く放置していた。 今日、キーバインド.htmlに気まぐれでアクセスしてみた。 すると、あれ?、画像が表示されてない… 調べてみると、原因は、「キー

    sirocco
    sirocco 2013/07/15
    「濁点付き全角カナ」 が2種類ある?
  • ほら貝:文字コード

    <BODY BGCOLOR="#04CBCA" LINK="#00008B" VLINK="#403C3C"> <H1><FONT SIZE=5>文字コード問題を考える</FONT></H1> <BR>&nbsp; <BR> <HR> <BR> <DL><DL><DL><FONT FACE="MS明朝"> <DT><B><A HREF="revised.htm">◇</A> 主な変更履歴</B> <DD><BR> <DT><B><A HREF="show.htm">◇</A> 小は大をかねるか?</B> <DD><BR> <DT><B><A HREF="revised.htm">◇</A> 主な変更履歴</B>            Nov07 1998更新 <DD>&nbsp; <DT><B><A HREF="show.htm">◇</A> 小は大をかねるか?</B>         N

  • 「はしご高」と「立つ崎」の文字コード - エコなび日記:楽天ブログ

    2008.09.21 「はしご高」と「立つ崎」の文字コード カテゴリ:PCソフト JIS X 0208:1997に含まれないが、人名にしばしば使われる二つの文字について、 文字コードをまとめておきます。 は、いわゆる「はしご高」と呼ばれる、「高」の俗字とされている文字です。 は、いわゆる「立つ崎」とよばれる、「崎」の旧字です。 表 はしご高と立つ崎の文字コード文字(はしご高)(立つ崎) UnicodeU+9AD9U+FA11 ブロック名CJK Unified IdeographsCJK Compatibility Ideographs JIS X 0208:1997なしなし JIS X 0213:2004なし1-47-82 SJISFBFCFAB1 JIS X 0213:2004にない/あるでは差異がありますが、 JIS X 0208:1997にはない、Unicodeにはある、という点では

  • ウェブマスターのための文字化け講座

    (序論)文字化けの発生メカニズム概論と解析方法 ネスケ4.Xで特定の文字(試・時・事・私など)が文字化けする場合 → document.writeで文字化けする漢字の規則性 → ネットスケープ4.Xのキャッシュ機構 → 2種類の解決方法 CGIで特定の文字(表・予・申・能・ソ・十など)が文字化けする → Shift_JISでCGIを作成する場合の注意点 → PHPで「表\示」「十\和田湖」「申\し込み」などと表示される場合 「(はしご高)」が使えない理由 → Windowsでは表示されるが、Macでは文字化けする文字 → Macでは表示されるが、Windowsでは文字化けする文字 → 機種依存文字チェック・プログラム(Flashフォームなど) 文字化けしないための工夫 → メタタグの指定は有効か? → 「美乳」で文字化けが直るって当? フォントを指定したら文字化けした。 → フォントの指

  • シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories

    2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。 最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。 おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。 変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。 変換表に求めら

  • 文字化けクイズ(問題編) - 西尾泰和のはてなダイアリー

    みんな安易に「文字化けした!」って言うけど、いろいろ雰囲気の違う文字化けがあるじゃないの、というわけで5問ほどクイズにしてみた Q1(初級): 「こんにちは、世界」と表示されるはずなのになぜか「縺薙」などの難しい漢字が表示された。何が起きたか。 Q2(初級): 「こんにちは、世界」と表示されるはずなのになぜか「ã」(aの上に~)などが表示された。何が起きたか。 Q3(中級): ブラウザであるリンクをクリックしたところ「臼NG」で始まる謎の文字列が表示された。何が起きたか。 Q4(上級): 「こんにちは」と表示されるはずなのになぜか「S?kao」と表示された。何が起きたか。 Q5(上級): 「ファイルが見つかりません」と表示されるはずなのになぜか斜め四角に囲まれた疑問符などが表示された。何が起きたか。なお参考までに表示された文字列は20文字であり、表示されたウェブページのエンコーディングはu

    文字化けクイズ(問題編) - 西尾泰和のはてなダイアリー
  • ruby|perl - 文字コードのちょっと高度な判定 : 404 Blog Not Found

    2007年01月11日21:00 カテゴリLightweight Languages ruby|perl - 文字コードのちょっと高度な判定 これははっきり言って悩ましい。ですが、判定が曖昧な場合はその旨をきちんと通知するのがBetter Practiceではないかと思います。 Matzにっき(2007-01-03) 手元のcalkiがUTF-8の「》」相当の文字(U+8BB)を含むエントリが文字化けするので、 nkf-utf8のソースを見てみた。 どうも自動判定の優先順位がEUC-JP,SJIS,JIS,UTF-8で固定されていて、 EUCの範囲内に収まる文字列はすべてEUC-JPとみなすことになっている。 で、UTF-8の「》」はEUC-JPの「損」と同じバイト列なのだ。例えば、以下を行ごとにコード判定すると、以下のような結果になります。 son.utf8 » 損 »損 »Son nk

    ruby|perl - 文字コードのちょっと高度な判定 : 404 Blog Not Found
  • perl, python & ruby - chr() vs. Unicode : 404 Blog Not Found

    2006年11月23日22:00 カテゴリLightweight Languages perl, python & ruby - chr() vs. Unicode というわけで、404 Blog Not Found:There's more than one language to cook your problemsでPython & Ruby Cookbooksを一気読みしたので、気になる点を少しずつ書いて行くことにする。 まずは、文字の扱い。文字列でない点に注意。 少なくとも、文字列をバイト列と見なして相互変換することは、LLに限らずたいていの言語で出来るようになったのだけど、文字を文字として扱うという点に関しては各言語ともまちまちで、多言語派の私としては結構頭のいたいところ。 ここでは、私が一番流暢なPerlを軸に、RubyPythonではどうなっているのかを調べてみた。 数値

    perl, python & ruby - chr() vs. Unicode : 404 Blog Not Found
  • 1