![Google、オープンソースフォント「Noto」がUnicode標準をフルサポートしたことを明らかに](https://cdn-ak-scissors.b.st-hatena.com/image/square/5cc70aa9647350742b31d2c23ed930bbed5759b4/height=288;version=1;width=512/http%3A%2F%2Fforest.watch.impress.co.jp%2Fimg%2Fwf%2Flist%2F1024%2F125%2Fimage1.jpg)
内容:「総合漢字チェッカー」は、テキストに含まれる常用漢字や教育漢字などをまとめてチェックできるサービスだ。小学校の指定した学年では読めない漢字をチェックしたり、常用漢字やJISの指定水準に含まれない漢字をすばやく見つけられるほか、文字数や漢字使用率のチェックもまとめて行える豊富な機能が売りだ。 「総合漢字チェッカー」は、テキストに含まれる常用漢字や教育漢字などをまとめてチェックできるサービスだ。小学校の指定した学年では読めない漢字をチェックしたり、常用漢字やJISの指定水準に含まれない漢字をすばやく見つけられるほか、文字数や漢字使用率のチェックもまとめて行える豊富な機能が売りだ。 使い方は簡単で、サイトの入力フォームにテキストを貼り付けたのち、下段からチェックしたい項目を選択して「チェック」ボタンをクリックするだけ。チェックの結果、条件に当てはまる漢字が赤字で強調表示されるという仕組みだ
What in the world could オントロ (ontoro) and グスーム (gusūmu) possibly mean? (If you wait a few seconds, a hint will flash in the animated GIF above.) Continue reading… The UTC #160 meeting took place last week at Microsoft’s HQ in Redmond, Washington. For CJK enthusiasts, the big news is that the UTC accepted CJK Unified ideographs Extension G (aka IRG Working Set 2015), which includes 4,939 characters
米Twitterが絵文字をオープンソース化し、GitHubでソースコードを無償公開した。Web版で使用している、Unicodeで規定された872個の絵文字を利用できる。 日本のフィーチャーフォン文化に端を発する絵文字は、UnicodeによるサポートとiOSへの標準搭載などがきっかけに世界中で使われるようになっている。英語圏では絵文字だけのチャットサービス、SNSなども登場している。 Unicodeで標準化されたとはいえ、各社がプロダクトに用いる際は独自にデザインしなければならず、多数の絵文字に対応するのは簡単なことではない。Twitterでも、チューリップ型の「名札」、打ち上げ式ではなく手持ちの「花火」など日本の文化・風習と結びついたものが多いため、米本社で働く日本人エンジニアが1つずつレビューしながら制作したという。 ソースコードはMITライセンス、グラフィックスはクリエイティブ・コモン
Summary The Unicode code charts generally show characters oriented for horizontal presentation. However, some of the glyphs are actually oriented for vertical presentation. A few characters change shape or orientation when the text is rotated from horizontal to vertical. When text is presented, there are various conventions for the orientation of the characters with respect to the line. In most ca
Appleカラー絵文字の「勝ち誇った顔」(U+1F624 FACE WITH LOOK OF TRIUMPH)をUnicodeのコード表と比べると、かなり印象が異なる。予備知識なしに両者を見て「同じ字」だと思う人はいないだろう(下図)。 Appleカラー絵文字のうちモノクロのもの(Lionで追加された分)は、ケータイ絵文字のUnicodeへの収録過程におけるGoogle・Apple提案(いちばん最初の提案)の字形を流用しているようだ。 しかし、「勝ち誇った顔」は、非常にややこしい経緯のあった字で、審議の過程で本質的な修正がなされている。この字については、Appleカラー絵文字でもUnicode 6.0の例示を尊重したものを実装して欲しかった。 Google・Apple提案の「勝ち誇った顔」のグリフを修正するべきだった理由は「Unicodeのケータイ絵文字対応表への疑問」(この記事におけるU
JEPAによる「出版物のUnicode化推進セミナー」をきっかけに、IVSについて熱く語り合った記録。思いがけず沢山の人が呼応してくれたので、まとめておきます。 IVSについては「UTS #37 UNICODE IDEOGRAPHIC VARIATION DATABASE」(http://unicode.org/reports/tr37/)、安岡孝一「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」(http://itpro.nikkeibp.co.jp/article/COLUMN/20100126/343783/)、拙稿「包摂された字体を区別できる異体字シーケンス」(http://internet.watch.impress.co.jp/cda/jouyou/2008/09/09/20793.html)あたりをご参照ください。
概要 『漢字データベースプロジェクト』は、Unicode / UCS (Universal Multiple-Octet Coded Character Sets) によって符号化された漢字(CJK統合漢字)の情報交換・検索照合・分析に役立つ様々なデータベースを整備することを目的に、2003年度に日本学術振興会科学研究費補助金・研究成果公開促進費(データベース)の援助を受けて開始しました。 各種漢字データファイルは、GitHubにて管理されており、GitHubサーバから取得することができます。 ライセンスについて 本プロジェクトのデータは、GPLライセンスおよびMITライセンスにて配布しています。 GPLライセンスによる配布 IDSデータ(ids.txt) 説文解字注(六書音均表等を含む)データ 宋本廣韻データ 學生字典データ MITライセンスによる配布 上記以外のすべてのデータ(以下を含
SVGフォントでIVSが表示できれば幸せになれるんじゃないか。 手順 1. IVS対応フォントの入手 とりあえずテストのためグループ:IVSテスト - GlyphWikiを使う。 2. FontForgeでSVGフォントの出力 ダウンロードしたttfフォントを開いてSVGフォントとして出力、で済めばよかったのだけれども、使っているfontforge 20090923だと修正が必要みたい。 具体的には 「<glyph glyph-name="u10C000" unicode="丈" unicode="󠄀" 」と出力されているので(たぶんバグ)、「<glyph glyph-name="u10C000" unicode="丈󠄀" 」に修正。「;" unicode="」を「;」に置き換えする。 「<svg>」を「<svg xmlns="h
このホームページ 及び 点字ビューア(Braille Viewer) では、点字(6点)で表現している部分があります。 このホームページについては、米国マイクロソフト社が開発したウェブ表示技術(WEFT) 及び CSS 3の「Webフォント」の機能を応用しているため、以下のバージョンのブラウザを使用していれば 自動的に正しく表示されます。 Internet Explorer (Windows版 4以降) Firefox (3.6以降) Google Chrome (6以降) Safari (5.1以降) Opera (11.10以降) 他のブラウザや古いバージョンだと ・ □ ? などに文字化けしてしまいますが、 そのような場合、ここで提供する点字フォントを使用すると正しく表示することができます。 なお、従来から日本で使用されている代表的な点字フォントには、多くの問題点があり またWind
各種調査ノート Unicode Ideographic Variation Sequence の概要 † 用語 Ideographic Variation Sequence = IVS variation sequence を表すコード列 Ideographic Variation Collection = IVC IVS の集合 Ideographic Variation Database = IVD IVS と IVC に名前を付けるデータベース 大ざっぱな構造 平たく言えば、文字コードを細かく切って固定小数点実数にするだけの仕組み 三段階に管理スコープを分ける 一個 = IVS 部分 = IVC 全体 = IVD IVS 固定小数点実数値の文字コード(に名前を付けたもの) 一つの IVS に一種類の字形が対応 IVS の整数部分が「base character」 整数部分が同じ字を「
Adobe-Japan1-6 Unicode — : Unicode Adobe-Japan1-6 Adobe Systems : PDF CID OpenType/CFF Adobe-Japan1-6 vs. Unicode — Character codes in Japan Koichi Yasuoka Author Abstract: In Japan we use so many kanji variants to describe the names of people and the names of places. Since proper nouns are out of the scope of Joyo-Kanji (daily use kanji characters in Japan), the kanji glyphs used in Jinmei-yo-Kan
「漢字1文字は2バイト」という常識が、大きく変わろうとしている。現在改正中の「常用漢字表」に対応するためには、Unicodeの4バイト文字を使用する必要があるが、それだけでは済まない恐れがある。今後、戸籍や住民基本台帳で使われている文字がUnicodeに追加されると、漢字1文字が最大8バイトになるかもしれない。文字コードに詳しい京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。(日経コンピュータ) 先日公開した『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』の読者から、「今後のシステムでは漢字1文字を最大4バイトで処理すればいいのか」という質問を頂いた。実は、UTF-8あるいはUTF-16で漢字を表す場合、最新のUnicodeにおけるIVS(Ideographic Variation Sequence)を考慮すると、漢
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く