タグ

文字コードに関するzichaoのブックマーク (102)

  • 嶲 - CJK COMPATIBILITY IDEOGRAPH-2F9F4 (U+2F9F4)

  • Unicode一覧表

    Unicode対応の文字コード表です。項目を指定しリストの確認ができます。ユニコードとは、文字コード規格の1つで、1993年に符号化文字集合や文字符号化方式など国際標準化機構(ISO)によって標準化された文字コード体系です。

  • ものかの » UTF-8-MAC は文字コードかな…

    昨日の記事「UTF-8-MAC なんていう文字コードはありません」は言いすぎだったようです。一夜明けて思い直したので、ここで修正しておきます。 「文字コード」というは、各人各様でかなり...UTF-8-MAC は文字コードかな… 昨日の記事「UTF-8-MAC なんていう文字コードはありません」は言いすぎだったようです。一夜明けて思い直したので、ここで修正しておきます。 「文字コード」というは、各人各様でかなり広くて大雑把な言葉です。それなのに「文字コードではない」と断定的に言ったのはまずかった。 それから「テキストエンコーディング」。この言葉はただ単にエンコーディングとも呼ばれますが、符号化方式のことではありません。言ってみれば、名が体を表していない。たとえば、CP932 と MacJapanese。この2つはエンコーディング名として区別されていますが、符号化方式はまったく同じです。 エ

  • ものかの » UTF-8-MAC なんていう文字コードはありません

    「OS X のファイルシステムの文字コードは UTF-8-MAC である」という完全に間違った情報があちこちで見られるので、ここで注意を促しておこうと思います。 状況を整理します。OS X のファイルシステムは HFS+。ここでいう文...UTF-8-MAC なんていう文字コードはありません 「OS X のファイルシステムの文字コードは UTF-8-MAC である」という完全に間違った情報があちこちで見られるので、ここで注意を促しておこうと思います。 状況を整理します。OS X のファイルシステムは HFS+。ここでいう文字コードはテキストエンコーディング。したがって、主題を正確に表現すると「HFS+がファイル名などを管理するときのテキストエンコーディング」ということになりますが、実はこの主題の立て方そのものが間違っています。 彼らが問題にしているのは、ファイル名に結合文字列が混在してしま

  • 《Unicode/CJK統合漢字》漢字検索

    《Unicode/CJK統合漢字》 漢字検索 このページは、UnicodeのCJK統合漢字(CJK統合拡張A・B・Cを含む)及びCJK互換・CJK互換補助漢字について、各種文字コードや代表的な音訓読みなど、主に情報システムでの漢字の利用に役立つ情報を検索できるようにしたものです。 ◆漢字部首検索 左側のフレームに表示される漢字の部首一覧から探したい漢字の部首を選択してください。 右側のフレームに部首を除く画数順の漢字の一覧表が表示されます。 ◆漢字画数検索 左側のフレームに表示される漢字の画数一覧から探したい漢字の総画数を選択してください。 右側のフレームに部首順の漢字の一覧表が表示されます。 ◆漢字読み検索 左側のフレームに表示された漢字の読み一覧から探したい漢字の読みの頭文字を選択してください。 右側のフレームに音訓混合の読み順に漢字の一覧表が表示されます。 ◆漢字コード検索 左側のフ

  • 本当は怖い文字コードの話 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    本当は怖い文字コードの話 記事一覧 | gihyo.jp
  • 日本の文字とUnicode 第6回 | 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第4回・第5回に引き続き、第6回も、漢字とUnicodeの関係です。 まずは「晴」(U+6674)のIVSを見てみましょう。 何だか妙な感じですね。同じ「晴」が<U+6674 U+E0100>と<U+6674 U+E0103>に、同じ「晴」が<U+6674 U+E0101>と<U+6674 U+E0102>に、それぞれダブって収録されているように見えます。実際そうなのです

  • Vistaで化ける字,化けない字(続報)

    前報で述べた通り,マイクロソフトのWindows Vistaでは,文字コードにUnicodeを使いながら,Unicodeとは異なる文字コード規格のJIS X 0213をサポートする,という方式を取っている。というのも,Windows 98日語版以降ずっとサポートしてきたCP932(名はWindows Codepage 932,いわゆるMS 漢字コード)やJIS X 0212を捨てるわけにはいかないので,CP932もJIS X 0212もJIS X 0213もみんなまとめてUnicodeで扱う,というやり方を取らざるをえないのである。 前報では,JIS X 0213の第一水準~第三水準漢字7614字について,Vistaで新たに採用された日フォントセットであるメイリオとXP以前のMSゴシックを見比べ,7614字のうち325字*が,VistaとXP以前との間で文字化けする(ここでは来表

    Vistaで化ける字,化けない字(続報)
  • Vistaで化ける字,化けない字

    11月30日に企業向けには出荷が始まったWindows Vista。そのVistaで,“文字化け”が起こるらしい。文字化けといっても,Webアクセス中にたまに見かける全く読めない文字の羅列になることはほとんどなく,その多くは似た文字が表示される程度である。ここでは,来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う。 Microsoftは,Windows 98日語版の発売以来,Windows 2000,Windows Me,Windows XPまでCP932(名はWindows Codepage 932,いわゆるMS漢字コード)とJIS X 0212をサポートしてきたが,最新のWindows VistaではJIS X 0213に乗り換えた。いや,乗り換えたというのは,ちょっと語弊がある。CP932とJIS X 0212に加えて,JIS X 0213もサ

    Vistaで化ける字,化けない字
  • Stirling - スターリング

    ソフト詳細説明 Stirling(スターリング)はWindowsバイナリエディタの新たな定番となるべく最強を目指して開発された高機能バイナリエディタです。 「アンドゥ・リドゥや置換もできないのに名前だけは有名なエディタ」を今でも使っている人はこの機会に是非一度、Stirling を試してみてください。 柔軟なカスタマイズと強力な各種機能を有し、使い込むほどに手になじみ手放せなくなるツールとなっています。 【特徴】 ■テキストエディタにも匹敵する強力なカスタマイズ機能 ・2ストロークキーや Esc メニュー、DOS 型選択操作も可能なキーカスタマイズ ・10個まで定義できるユーザーメニュー、各メニューは最大30項目まで指定可能 ・表示項目を指定可能なツールバーカスタマイズ ・各種編集情報が指定可能なステータスバーカスタマイズ ・拡張子別に表示色やキャラクターセットが指定できる拡張子別設定機

  • 本当は恐ろしいInDesignの話 〜文字化け問題 | 電書魂

    前回のエントリーで書かせていただいたInDesignデータからの電子書籍化に伴う外字処理の問題について、文字コード・フォント関連について豊富な知識をお持ちの方々に関心を持っていただき、これをどうにかするための取り組みが始まりました。具体的にはものかのさん、moji_memoさん、市川せうぞーさんの面々で、ちょっととんでもないレベルの方々です。これに対して、publidge(出版デジタル機構)の深沢さんからも関心を寄せていただき、フォントメーカーの方にもアドバイスをいただく形で電子書籍の外字問題に対しての取り組みが始まりました。以下は現時点で判明している問題についての簡単なまとめです。いずれこれに関してはpublidgeから正式にどういった対策をとるべきかのアナウンスがあることと思われますが、すでにかなり「恐ろしい」事実が判明しているので、事前段階での告知の一翼を担う意味で書かせていただきま

  • Explzh - 多形式に対応した、圧縮・解凍ツール

    Explzh は LHA,ZIP(X),CAB,RAR,7z,tar,tar+(gzip, bzip2, lzma, xz(lzma2), zstd) 形式書庫に対応した、 大容量のファイルも扱える 圧縮解凍ソフトです。 MAX_PATHを超えるロングパス名に対応 しており、また書庫の解凍で問題となる ファイル名文字の文字化け問題を解決 します。 強力な AES 暗号化 ZIP の暗号化・復号化 に対応。暗号化書庫を一元管理する パスワードマネージャ 機能から、暗号化された書庫はマスターパスワードの一回の入力で解凍・編集の操作ができます。

    zichao
    zichao 2012/04/30
    ファイル名の文字化けを防ぎ、意図した解凍処理を行う。 Unicode や UTF-8-MAC にも対応
  • 無料 圧縮・解凍ソフト CubeICE - CubeSoft

    解凍時の文字化けトラブルを防止 Mac のように Windows 標準とは異なる文字コードを採用している OS で圧縮したファイルを解凍すると、ファイル名が文字化けを起こす事があります。 CubeICE は、圧縮ファイルの文字コードを自動判別し、適切な文字コードに変換する事で文字化けを防ぎます。 様々な圧縮形式にも対応しており、zip, 7-zip, lzh, rar, tar, gzip, bzip2, xz を始めとした 20 種類以上の圧縮ファイルを解凍する事ができます。 ファイル名の文字化けを防止 Mac のように Windows 標準とは異なる文字コードを採用している OS で圧縮したファイルを解凍すると、 ファイル名が文字化けを起こす事があります。 CubeICE は、圧縮ファイルで使用されている文字コードを自動的に判別し、 適切な文字コードに変換する事で文字化けを防ぎます。

    無料 圧縮・解凍ソフト CubeICE - CubeSoft
  • javascriptで日本語文字の種類(漢字・ひらがな・カタカナ)を判別するためのメモ - 超自己満足プログラミング

    (※) PDFは重いものもあるので注意 漢字 CJK統合漢字:http://www.unicode.org/charts/PDF/U4E00.pdf CJK統合漢字拡張A:http://www.unicode.org/charts/PDF/U3400.pdf CJK統合漢字拡張B:http://www.unicode.org/charts/PDF/U20000.pdf CJK互換漢字:http://www.unicode.org/charts/PDF/UF900.pdf CJK互換漢字補助:http://www.unicode.org/charts/PDF/U2F800.pdf function isKanji(c){ // c:判別したい文字 var unicode = c.charCodeAt(0); if ( (unicode>=0x4e00 && unicode<=0x9fcf)

    javascriptで日本語文字の種類(漢字・ひらがな・カタカナ)を判別するためのメモ - 超自己満足プログラミング
  • 文字化け解読ツール「もじばけらった」

    ご利用に関する諸注意 サービスは smkn (From kiki verb) によって、”現状のまま” 提供されるものとします。サービスについては、明示黙示を問わず、商用品として通常そなえるべき品質をそなえているとの保証も、特定の目的に適合するとの保証を含め、何の保証もなされません。事由のいかんを問わず、損害発生の原因いかんを問わず、且つ、責任の根拠が契約であるか厳格責任であるか (過失その他) 不法行為であるかを問わず、smkn (From kiki verb) も寄与者も、仮にそのような損害が発生する可能性を知らされていたとしても、サービスの使用から発生した直接損害、間接損害、偶発的な損害、特別損害、懲罰的損害または結果損害のいずれに対しても (代替品またはサービスの提供; 使用機会、データまたは利益の損失の補償; または、業務の中断に対する補償を含め) 責任をいっさい負いません

    文字化け解読ツール「もじばけらった」
  • どなたか教えてください・・・

    Lion[Mac OS X 10.7.3]になって四苦八苦しています。 古いワープロ文書がたくさんあるのに開けません。 どなたか Pages で読む方法を教えてくださるとありがたいです。 開けないワープロファイル: ・Microsoft Word 1.x-5.x 文書 ・マックライト II 書類 どうしても見る必要があるのですが読めなくて困っています・・・ *     *     * 追記:古い書類を見たいけれど(2月14日) [開けないファイル] 多くの読者がアドバイスを寄せてくださっていることに感謝します。 お礼方々途中経過のご報告・・・ *     *     * 読みたい書類 読みたいと思っているのは次の書類群です。 ・1997 年のマックライト II の書類 ・2000 年の MS Word 4 の書類 15年も前のファイルを読もうなんて酔狂だと思われた方もおられたようです。 筆

    どなたか教えてください・・・
  • 日本語URL変換ツール ~ ピュニコード(Punycode)・UTF-8などのエンコードに

    語URL変換ツール 日語URL(ドメイン(Punycode)、パス)のエンコードとデコードを行います。 変換したいURL・ドメイン・パスの入力 変換モード: URL ドメイン ファイル名 文字コード: UTF-8 EUC-JP SHIFT-JIS 変換結果 動作モード: Punycode only version © 2007-2022 N7.com

    zichao
    zichao 2012/02/12
    %E3%83%87%E3%82%B9%E3%82%AF%E3%83%88%E3%83%83%E3%83%97の解析
  • IVSとGSUBはどう違うのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    異体字シーケンス(IVS)の特徴について、OpenTypeフィーチャのグリフ置換(GSUB)と比較しながら考えてみた。重要だと思われる点をメモしたものであり、IVSの体系的な説明ではない。 IVSは文字コードのレベルの枠組みなので、異体字の情報をプレーンテキストで交換できる。この最大の特徴に加え、GSUBよりも新しい分、よりすっきりとした論理的な仕組みになっている*1。 IVSの概念は、下図のようなかんじ。符号位置に包摂される複数のグリフ(集合)のなかから、ある特定のグリフ(集合)をVSによって指定する、というイメージ*2。 上図はUnicodeの視点から描いたものだが、Adobe-Japan1フォントではデフォルトのグリフはcmapで指定されているので、実装としては下図のようなかんじ。IVSでは、原則として基底文字(親字)の包摂範囲を超えたグリフは指定できないので、VSを付けることによっ

    IVSとGSUBはどう違うのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    zichao
    zichao 2011/12/20
    再び予習
  • サロゲートペア入門

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理

    サロゲートペア入門
  • JavaScriptによる英数字/記号/カタカナの全角半角変換

    文字変換機能 ここでは、JavaScriptによる英数字記号空白/カタカナの半角全角変換とひらがな/カタカナの変換ツール、 文字変換の用途についての考察や、変換処理の実装方法の説明に加え簡単なパフォーマンステストなどを行います。 このツールは元々FormCtrlでの、 フォームに入力された文字の全角/半角変換を行う強制(自動)変換のコードを書いていた時に、 それぞれ対応する文字コードを調べる用途と、その変換のチェックの為に書いたものですが、 結構便利なので変換や文字コード関連ツールとして公開します。 変換処理のコードもMITライセンス形態で公開しています。ダウンロードはこちら。 現状ではほとんどドキュメント的な物は有りませんので、暇な方はソースを読んで自由にご利用下さい。 文字変換機能については、iGoogle用のGadgetとしても利用可能です。 ガジェットを追加 ここでの文字コードは全