タグ

unicodeに関するAJYAのブックマーク (13)

  • 「●」が小さく見えることがあるのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    (ホー先生)Macの画面で「●▲■」の「●」と「■」だけが小さく見えることがあるのはなぜじゃ*1。 「●」と「■」が欧文フォントで表示されているからだよ。たとえばMacのFinderでは、ファイル名は「Lucida Grande優先」で表示される。Lucida Grandeは「●(U+25CF)」や「■(U+25A0)」のグリフを持っているけれど、「▲(U+25B2)」のグリフを持っていない。だから「▲」はヒラギノで表示されて、「●」と「■」だけが小さく見えるんだ。同じ理由で起きる現象としては、三点リーダの位置が下にズレたりすることも、よくあるよね。 Finder以外でもよくあるんじゃが。 Appleのソフトは世界共通の仕様なので、デフォルトは欧文フォントだよ(下図)。 日フォントを指定すれば、この問題は避けられるのか。 うん。Finderでは基的にフォントの変更はできないけどね。そ

    「●」が小さく見えることがあるのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • それ Unicode で

    UTF-7 を使ってスクリプトを記述 +ADw-SCRIPT+AD4-alert(\'XSS\');+ADw-+AC8-SCRIPT+AD4- IE は、文字エンコーディングが不明で UTF-7 っぽい文字列があれば、自動判別で UTF-7 となる。

    AJYA
    AJYA 2006/12/14
  • Unicode (utf-8 encoded) Testpage

    0x0000: 0x0010: 0x0020: !"#$&'()*+,-./ 0x0030: 0123456789:;<=>? 0x0040: @ABCDEFGHIJKLMNO 0x0050: PQRSTUVWXYZ[\]^_ 0x0060: `abcdefghijklmno 0x0070: pqrstuvwxyz{|}~� 0x0080: 0x0090: 0x00a0:  ¡¢£¤¥¦§¨©ª«¬­®¯ 0x00b0: °±²³´µ¶·¸¹º»¼½¾¿ 0x00c0: ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ 0x00d0: ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞß 0x00e0: àáâãäåæçèéêëìíîï 0x00f0: ðñòóôõö÷øùúûüýþÿ 0x0100: ĀāĂ㥹ĆćĈĉĊċČčĎď 0x0110: ĐđĒēĔĕĖėĘęĚěĜĝĞğ 0x0120: ĠġĢģĤĥĦħĨĩĪī

    AJYA
    AJYA 2006/12/08
  • dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年10月時点の調査。

    AJYA
    AJYA 2006/12/07
  • 文字コードの変換 - 葉っぱ日記

    あまり知られていないことですが、WindowsAPIである MultiByteToWideChar および WideCharToMultiByte を使うと、ISO-2022-JPやUTF-8などの各種の文字コードを変換することができます。正確に言うと、Unicodeとそれ以外のコードページ間で文字列をマップすることができる、ということです。変換は、Unicodeとそれ以外のコードページの間で行うことになりますので、ISO-2022-JPとシフトJIS(Windows-31J)のような、Unicode以外の文字コード間での変換では、いったん文字列をUnicodeに変換してやる必要があります。 ここまで説明なしに「Unicode」と書きましたが、実はこれは Microsoft 特有の表現であり、UnicodeのUTF-16LEのことを意味しています。同じUnicode*1でもUTF-7やU

    文字コードの変換 - 葉っぱ日記
    AJYA
    AJYA 2006/12/07
  • C++ Note : UNICODE経由の文字コード変換

    MultiByteToWideCharとWideCharToMultiByteを使用して、任意のコードをUNICODE経由で変換できる。 MultiByteToWideChar では読み込ませる文字コードを指定し、 WideCharToMultiByte では変換したい文字コードを指定する。 ※MultiByteToWideCharを使っただけだと、UNICODE(UTF16)の状態になる。 ここから何か指定のコードに変換したい場合にWideCharToMultiByteを使用する。 ANSI→UNICODE int MultiByteToWideChar(   UINT CodePage, // コードページ   DWORD dwFlags, // 文字の種類を指定するフラグ   LPCSTR lpMultiByteStr, // マップ元文字列のアドレス   int cchMultiB

    AJYA
    AJYA 2006/12/07
  • http://homepage1.nifty.com/MADIA/vb/vb_bbs2/200401_04010054.html

    AJYA
    AJYA 2006/10/07
  • http://rararahp.cool.ne.jp/cgi-bin/lng/vb/vblng.cgi?print%20200508/05080003.txt

    AJYA
    AJYA 2006/10/07
  • winapi-database.com

    AJYA
    AJYA 2006/10/07
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    AJYA
    AJYA 2006/10/07
  • Yu TANAKA's Works:S-JISからUTF-8への変換

    UTF-8 というステップを踏めばよい。因みに、ここで変換されるUTF-8には先頭 3バイトのBOM(Byte Order Mark)はつかない(UTF-8Nと呼ばれることも ある)。よって、そのままJADやMANIFESTに利用可能 (UTF-8UTF-8Nの違いについては こちら を参照下さい[2002/10/29])。 ■変換関数例 最初にコンバートしたデータを格納するのに必要な 容量を調べて、その分の容量を確保してコンバートし、そのデータを 引数で与えた領域に収まる分だけコピーしている。S-JISもUTF-8もNULL 終端。 //--------------------------------------------------------------------------- // doconv() //! 実際の変換処理。 /*! \param ssrc [i] 変換元の文

    AJYA
    AJYA 2006/10/07
  • 1