Unicode対応の文字コード表です。項目を指定しリストの確認ができます。ユニコードとは、文字コード規格の1つで、1993年に符号化文字集合や文字符号化方式など国際標準化機構(ISO)によって標準化された文字コード体系です。
Unicode対応の文字コード表です。項目を指定しリストの確認ができます。ユニコードとは、文字コード規格の1つで、1993年に符号化文字集合や文字符号化方式など国際標準化機構(ISO)によって標準化された文字コード体系です。
Macユーザーなら、HFS+の勝手なファイル名の「正規化」には悩まされてますよね! まず浅い理解として、HFS+はファイル名をNFDに正規化する。次に、HFS+は互換漢字を統合漢字にはぜず、それ以外をNFDに正規化する。まあそれで合ってるんですけれど、実際にはそんな簡単な話ではありません。 この記事では、カーネルが行なっているファイル名の変換の再現に挑戦します。 ソースコード こういうものは一次ソースを見るのが一番です。外から挙動を推測したって見落としは出ます。Darwinのカーネルはオープンソースになってますので以下で見ることができます。 ファイルアクセスは、Darwinカーネルの中のDarwinのカーネルであるXNUというモジュールが担当してます。 http://www.opensource.apple.com/source/xnu/ うろうろ まず、ファイルアクセスAPIからやって来
《Unicode/CJK統合漢字》 漢字検索 このページは、UnicodeのCJK統合漢字(CJK統合拡張A・B・Cを含む)及びCJK互換・CJK互換補助漢字について、各種文字コードや代表的な音訓読みなど、主に情報システムでの漢字の利用に役立つ情報を検索できるようにしたものです。 ◆漢字部首検索 左側のフレームに表示される漢字の部首一覧から探したい漢字の部首を選択してください。 右側のフレームに部首を除く画数順の漢字の一覧表が表示されます。 ◆漢字画数検索 左側のフレームに表示される漢字の画数一覧から探したい漢字の総画数を選択してください。 右側のフレームに部首順の漢字の一覧表が表示されます。 ◆漢字読み検索 左側のフレームに表示された漢字の読み一覧から探したい漢字の読みの頭文字を選択してください。 右側のフレームに音訓混合の読み順に漢字の一覧表が表示されます。 ◆漢字コード検索 左側のフ
現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日本語に特化して作られたわけではないので、日本の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第4回・第5回に引き続き、第6回も、漢字とUnicodeの関係です。 まずは「晴」(U+6674)のIVSを見てみましょう。 何だか妙な感じですね。同じ「晴」が<U+6674 U+E0100>と<U+6674 U+E0103>に、同じ「晴」が<U+6674 U+E0101>と<U+6674 U+E0102>に、それぞれダブって収録されているように見えます。実際そうなのです
更新:CC以降のマッピングファイルの場所を追記しました。 注1:ここで説明する方法は、くれぐれも自己責任で慎重に行ってください。 旧Aiファイル(=シフトJISベースで保存されるv10までのAiファイル)をMac版CS以降で開くと、シフトJIS外字がすべて化けます。こんな具合に。 見て分かるように、化けるだけではありません。文字そのものが完全に消失している箇所まであります。(イラレ8の文字化け見本ファイル) OpenTypeが登場するまで、日本のMac DTPでは83pvの和文PostScriptフォントが使われていました。83pvはWindowsのシフトJISであるCP932とほとんど同じです。シフトJIS外字領域の13区にもCP932と同様に丸数字、ローマ数字、単位記号などがあり、外字フォントなしで使えたため、日本語のMac DTPで普通によく使われました。その外字領域の文字がMac版
前報で述べた通り,マイクロソフトのWindows Vistaでは,文字コードにUnicodeを使いながら,Unicodeとは異なる文字コード規格のJIS X 0213をサポートする,という方式を取っている。というのも,Windows 98日本語版以降ずっとサポートしてきたCP932(本名はWindows Codepage 932,いわゆるMS 漢字コード)やJIS X 0212を捨てるわけにはいかないので,CP932もJIS X 0212もJIS X 0213もみんなまとめてUnicodeで扱う,というやり方を取らざるをえないのである。 前報では,JIS X 0213の第一水準~第三水準漢字7614字について,Vistaで新たに採用された日本語フォントセットであるメイリオとXP以前のMSゴシックを見比べ,7614字のうち325字*が,VistaとXP以前との間で文字化けする(ここでは本来表
11月30日に企業向けには出荷が始まったWindows Vista。そのVistaで,“文字化け”が起こるらしい。文字化けといっても,Webアクセス中にたまに見かける全く読めない文字の羅列になることはほとんどなく,その多くは似た文字が表示される程度である。ここでは,本来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う。 Microsoftは,Windows 98日本語版の発売以来,Windows 2000,Windows Me,Windows XPまでCP932(本名はWindows Codepage 932,いわゆるMS漢字コード)とJIS X 0212をサポートしてきたが,最新のWindows VistaではJIS X 0213に乗り換えた。いや,乗り換えたというのは,ちょっと語弊がある。CP932とJIS X 0212に加えて,JIS X 0213もサ
(※) PDFは重いものもあるので注意 漢字 CJK統合漢字:http://www.unicode.org/charts/PDF/U4E00.pdf CJK統合漢字拡張A:http://www.unicode.org/charts/PDF/U3400.pdf CJK統合漢字拡張B:http://www.unicode.org/charts/PDF/U20000.pdf CJK互換漢字:http://www.unicode.org/charts/PDF/UF900.pdf CJK互換漢字補助:http://www.unicode.org/charts/PDF/U2F800.pdf function isKanji(c){ // c:判別したい文字 var unicode = c.charCodeAt(0); if ( (unicode>=0x4e00 && unicode<=0x9fcf)
正規表現の文字クラスの略記法 \d と \s と \w がいつのまにかアレレなことになっていたのでメモ。(1 Perl 5.8 以降で正規表現を使うには use utf8 が必須。 use utf8 では \d と \s と \w の文字クラスの内容が Unicode のカテゴリーに基づいている。 InDesign(Boost)も同様。 PCRE や Ruby は変わりなし。 (2 参考資料:perldoc の perlrecharclass 参考資料:Programming Perl の 5.4. Character Classes ちょっと詳しく見ていきます。 *以降、Perl = use utf8 の Perl ほとんど全ての人が [0-9] の10文字として使っていますが、Perl では \p{Nd} です。ただし、Perlのバージョンによって(対応しているUnicodeバージョン
DUOクレンジングバームを購入できるツルハまとめツルハドラッグ 店舗 DUO ザ クレンジングバームのお買い物はご近所のツルハで! DUO ザ クレンジングバーム ▼毎月20%OFFはこちらから▼ ショップで購入する前に DUO ザ クレンジングバームを販売しているお店は、全国で10000件以上もあります。 ドラッグストアがその大半を占めているのですが、ツルハだけでも約1300件以上あるようです。 ということは、全国のDUOクレンジングバームを購入できるお店の約13%ぐらいがツルハドラッグですので、さすが大手のドラッグストア、凄いですね。 実は、ツルハの公式サイトの店舗数とDUOの公式サイトから抽出した数がピッタリ合いません。 調査したタイミングで数値に変動がありますし、どちらの公式サイトも店舗増減の修正が追いついてないことも考えられます。 さらに、当サイトの集計に間違いがあるかもしれませ
はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日本語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理
改訂:2017/07/22 Unicode 10.0に合わせて書き直し。正規表現を簡易にしようとしてやりすぎていたのを修正。 改訂:2023/03/21 U+30000以降を追加。InDesignの正規表現を追記。 正規表現で漢字の範囲指定をする場合、Unicodeではどうするかが悩ましいところです。 Unicodeの漢字の範囲として [一-龠] にしている例を見かけます。しかしこれは旧規格JIS X 0208の漢字が含まれる範囲をUnicodeの中から切り出しているだけです。互換漢字ブロックをまるごと取りこぼしているので、WindowsのシフトJIS(CP932)の拡張漢字に当たるものが含まれていません。現規格JIS X 0213の第3・第4水準漢字も考慮されていません。簡易な範囲指定だとしても、新常用漢字の「𠮟」が含まれておらず、今から見るとあまりに時代遅れです。 Unicodeのす
日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。
文字コードの歴史と関係を調べてみた。 ○UnicodeとJISの対応表 Unicode JIS リリース年 Unicode1.1 JISX0208 1992 Unicode2.0 JISX0213 1996 Unicode2.1 1998 Unicode3.0 1999 Unicode3.1 JISX0213 2001 Unicode3.2 JISX0213:2004 2002 Unicode4.0.0 2003 Unicode5.0.0 2006 ○JISの規格と文字数 JIS規格 通称 文字数 JISX0208:1978 JIS78 6802 JISX0208:1983 JIS83 6877 JISX0208:1990 JIS90 6879 JISX0212:1990 6067 JISX0208:1997 6879 JISX0213:2000 11223 JISX0213:2004 J
UnicodeのIVS(Ideographic Variation Sequence)は、漢字を表すUnicodeの直後に Variation Selectorと呼ばれるコードを付加し、漢字の「異体字」を表現する方法だ。IVSによって、従来よりも多くの字体が利用可能になる反面、データの「名寄せ」が困難になる恐れもある。文字コードに詳しい京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、IVSの利点と懸念すべきポイントを解説する。(日経コンピュータ) 筆者がITproに「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」を寄稿してから約1年が経って、IVSに新たな動きがあった。常用漢字表の改正(2010年11月30日)に前後して、4195字のIVSが追加されると同時に、IVS技術促進協議会が発足したのだ。IVSの拡大によって、これまでフォント切り換えでしか
前回までを振り返る--Unicodeコンソーシアムの影響力 前回はどこまでお話ししましたっけ。世界中の文字の収録を目的とした文字コード規格、Unicodeは、米国のIT企業を中心に結成されたUnicodeコンソーシアムが制定するデファクト規格に過ぎないこと。しかし公的な国際機関が定めるデジュール規格ISO/IEC 10646と同期することで、WTO/TBT協定にもとづき世界中の国々に普及させられるメリットを得たこと。 また、Unicodeコンソーシアム自体はオープンな組織だけれど、意志決定を行うUTC(Unicode Technical Committee/Unicode技術委員会)で一票を投じる権利を持つのは一握りの団体に限られること。そしてUTCはISO/IEC 10646のアメリカ・ナショナルボディであるL2委員会と合同でしか開催されておらず、同時にL2委員会とUnicodeコンソー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く