タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

文字に関するmurashitのブックマーク (39)

  • 『文字符号の歴史 ―アジア編―』を読んだ - にせねこメモ

    三上 喜貴『文字符号の歴史 ―アジア編―』(共立出版、2002年)を読んだ。 www.kyoritsu-pub.co.jp Unicode以前のアジアの文字コードについてまとめられた大著である。アジア編と題しているが、文字の種類ならアジアが世界の地域で最大なので、カバーする範囲はめちゃくちゃ広い。 書では活版印刷・タイプライター・電信から始まり、電算処理の需要からASCIIなどの文字コードが作成され、文字コードが多言語に拡大されていく流れを描き出している。2000年代以降の動向は別に調べないといけないが、Unicode以前の世界の文字コードについて知る最初のソースとして最適だと思う。 書を読んだことで気づき、とくに興味深く感じたことは、(特に初期の)Unicodeには元ネタがあるということだ。 Unicodeは既存の文字コードを処理するときの内部コードとして使えるように意図されており、

    『文字符号の歴史 ―アジア編―』を読んだ - にせねこメモ
  • ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ

    まえがき ミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか? それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。なぜそのようなものが登場し、普及することとなったのか、この記事で解説する。 目次 まえがき 目次 凡例 この記事で使う名称について ビルマ語表記 コードポイント ラテン文字表記について Zawgyiの概説と歴史 Zawgyiとは Zawgyiのダウンロード Zawgyi誕生・普及の経緯 複雑なビルマ文字 ビルマ文字とUnicode 回避策としてのビルマ文字フォントの登場 Zawgyiの普及 Zawgyiの実装 実装の方針 文字の並べ替えをせず、左から右に書く 文字の形のバリエーション

    ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ
  • UCS水平拡張公開レビュー | 一般社団法人 文字情報技術促進協議会

    文字情報技術促進協議会文字情報基盤委員会 委員長 高田智和 情報処理学会情報規格調査会SC 2専門委員会 委員長 田代秀一 今般、一般社団法人文字情報技術促進協議会(CITPC)と一般社団法人情報処理学会情報規格調査会SC 2専門委員会(JSC2)は、文字コードの国際規格を担当する国際機関、ISO/IEC JTC 1/SC 2 委員会で審議を予定している提案内容について、日の国内外のみなさまから、広くご意見をうかがうため、共同で公開レビューを行うことと相成りました。みなさまからの、忌憚ないご意見をいただけるようお願いする次第です。 レビュー対象 我が国では、人名や地名などの表記のために6万種以上の漢字が用いられています。行政文書などのデジタル化にあたり、これらの文字を国際規格に基づいて使用できるようにするため、2002年に開始された国の委託による調査・研究プロジェクト「汎用電子情報交換環

  • 中国人を悩ませるレアな名字の文字コード問題

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」(信息技術中文編碼字符集)が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される」と反射的に考えてしまうかもしれないが、これは文字コードの標準規格を新たに導入するという話だ。珍しい名字などに使われ、既存の文字コードに未登録の漢字に対応しようというものになる。 中国の面積は日の国土の約25倍で、約14億人の人口を擁している。一部の地域限定で使われている漢字や、少数民族の固有名詞でのみ用いられている漢字もある。文字コードに含まれない漢字を使っている人は約6000万人もいるそうだ。例えば、山東省青島市郊外にシュイユー村という地元ではまあまあ

    中国人を悩ませるレアな名字の文字コード問題
    murashit
    murashit 2023/05/31
    気軽に漢字廃止とか言いがちな人は「チャイニーズ・タイプライター』を読もう!
  • 文字コード | 衆議院議員 河野太郎公式サイト

    2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。 ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55,270文字もあります。 全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を2011年に策定し、それにあわせたフォントを作成し、無償で提供しています。 この「文字情報基盤」(MJ)には、58,862文字が含まれています。 しかし、このMJを全庁的に採用している自治体は、川口

    文字コード | 衆議院議員 河野太郎公式サイト
    murashit
    murashit 2023/05/11
    このへん、おいそれと縮退させるわけにもいかん話だしな
  • zi.tools 字統网

  • 本当は恐ろしい「〜」記号 : IT翻訳者Blog

    Yahoo Japanの「新型コロナワクチン情報まとめ」を見ていたら、次の画像があった。 アストラゼネカの行に「有効性 〜76%」とあり(赤枠)、私はここが気になってしまった。 (出典:https://news.yahoo.co.jp/pages/20210122、閲覧:2021-07-02) これを見た人は、普通は「最大で76%」と解釈するだろう。日語で「〜」は「数字の範囲」を示すのが一般的である。例えば共同通信社の『記者ハンドブック』でもその意味で使っている。範囲の右側だけに数字があるので「最大」という解釈になる。最大なのだから、有効性は10%かもしれないし60%かもしれない。 しかし日語の「〜」によく似た英語の「~」(チルダ)には別の意味がある。「約」や「およそ」である。この意味を掲載している辞書は実は少ないのだが、たとえばMerriam-Websterの「tilde」には2bに

    本当は恐ろしい「〜」記号 : IT翻訳者Blog
  • 写研アーカイブ

    写研の書体 写研がこれまでに発表・発売した書体をご覧いただけます。手動写植にしかない書体をのぞき、書体見は電算写植で作成されています。そのため、同名の書体でも手動写植とは一部の文字のかたちが異なることがあります。書体の名称および文字盤コードは発売時期により変更されていることがありますが、ここではその書体の最終的な情報で掲載しています。 写研の歴史 –1950 石井茂吉と写真植字 1951–1972 写研の誕生 1973–1992 華ひらく、日語書体 1993– 電算写植の完成、そして未来へ 写真植字 写真の原理を応用して、ネガ状の文字盤から1文字ずつ印字する手動写真植字機、入力データに基づいた自動印字を可能にした自動写真植字機、そしてコンピュータによるレイアウトと文字の出力を可能にした電算写植。写真植字を3つのカテゴリに分類し、そのしくみと写研の代表機種を紹介します。 資料 書籍 見

    写研アーカイブ
    murashit
    murashit 2021/05/27
    壮観ではある
  • どう違う? 「字体」「字形」「書体」「フォント」

    字形とは字体を目に見えるように表したもののことです。 反対に言うと、字体は目には見えないのです。 字体は文字の骨組みだといいましたが、字体が骨なら、字形は肉だと思えませんか。 書体とは何か 下の樹形図をご覧ください。 図左の枠内は広い意味での書体、右は狭い意味での書体です。 書体とは字形の様式のことです。 字体が骨だとしたら字形は肉だろうと書きました。それなら、書体は肉の付き方です。(ややこしくなりますが、字形を書体と同じように使うこともあります) 分類の仕方いろいろ アスリートと一様に呼ばれる人々でも、競技によって体つきが違いますよね。 漢字の、細い横線の右端に三角形が付いていて、縦線は(少なくとも横線よりは)太いなら明朝体です。 ゴシック体の線は太さが一定。そこから角をとったようなものは、丸ゴシック体です。 もちろんこの3種類だけではありません。 また、分類の仕方はいろいろで、「筆」「

    どう違う? 「字体」「字形」「書体」「フォント」
    murashit
    murashit 2020/12/08
    ここ読んどけばわかるよって言えるありがたいまとめ
  • 教材の書体を変えるだけで子どもの読解力が上がった!? モリサワに聞く「フォントのユニバーサルデザイン」(1)

    より多くの人にとって、使いやすいカタチを目指すユニバーサルデザイン。その考え方は文字の世界にも広まっており、国内のフォントメーカー各社は「ユニバーサルデザインフォント(UDフォント)」を手掛けています。 書体を変えても、言葉の意味は同じ。ですが、“見え方”が変わると、言葉の在り方はどれくらい変わるものなのでしょうのか。大手フォントメーカー・モリサワに取材し、日初のユニバーサルデザインの教科書体「UDデジタル教科書体」の開発者・高田氏、営業・盛田氏、瀬良氏に話を伺いました。 そもそもUDフォントとは? ―― そもそもUDフォントとはどんなものですか? 高田氏:人間の感覚は聴覚、触覚、嗅覚……などに分けられますが、情報の認知には視覚、特に文字情報の認知が大きな役割を果たしています。ですが、さまざまな事情から、読むことに困難さを抱えている人もいます。 UDフォントは「より多くの人に見やすく、読

    教材の書体を変えるだけで子どもの読解力が上がった!? モリサワに聞く「フォントのユニバーサルデザイン」(1)
  • N.(はるさん) on Twitter: "「さいたま市」の「さ」の字は繋げ字で描かないと怒られるというツイートを見て、「市民がうるさいんかな」とニヤニヤしてたら、まさかの埼玉職員共済広報誌(公機関に近い)にて「正式な字は繋げ字」「活字は必ず統一している」と指定されていて笑… https://t.co/t2DZlwKZDC"

  • 開発インタビュー: 『文字渦』の文字はいかに作られたか──「作字」をDNPメディア・アートに聞く ● type.center

    当サイトでもたびたび取り上げている円城塔氏の『文字渦』。ここでは文字について書かれた小説でありながら、実際の文字を作字したり、組版についての実験的なことなど、文字や文章、書籍についての形態にとっても、あたらしい試みとなりました。 今回、作字や組版・製版、といった作業でどのようなことが行なわれたのか、作者の円城塔氏へのインタビューに続き、今回は制作にあたった株式会社DNPメディア・アートの御三方に、新潮社の御二方も同席の上、お話を伺ってきました。 株式会社DNPメディア・アート 社内認定マイスター(秀英体フォント管理・作成) 高橋耕一さん プリプレス制作第1部 書籍組版センター 吉川正巳さん/長嶋英樹さん 株式会社 新潮社 「新潮」編集部 清水優介さん/出版部文芸第一編集部 加藤木 礼さん 聞き手:塚田哲也(大日タイポ組合)

    開発インタビュー: 『文字渦』の文字はいかに作られたか──「作字」をDNPメディア・アートに聞く ● type.center
  • アドビ 入社早々に総画数84画の漢字を作った話 #源ノ角ゴシック #AdobeFonts | Adobe Blog

    こんにちは!アドビのタイプデザイナーの吉田です。 昨年の4月に入社して間もなく、チーフデザイナーの西塚涼子さんからある漢字制作をまかされました。今回はその貴重な体験を執筆させていただこうと思います。 源ノ角ゴシックのアップデート それは源ノ角ゴシックのアップデートに伴うグリフの制作でした。源ノ角ゴシック2.0にとんでもない画数の漢字が追加されることは分かっていたのですが、まさかそれを自分が作ることになるとは思いませんでした。そう、ご存知の方もいらっしゃると思いますが、そのとんでもない画数の漢字とは「たいと/おとど」のことです。この漢字は、昔人名漢字として使われていたと一説には言われています。外見は複雑なようで単純明快「雲・雲・龍・雲・龍・龍」と、単体としても画数が多い漢字6つが1つの漢字の中に押し込められています。以前、源ノ明朝のリリースで「ビャン」という漢字が追加されたことを覚えています

    アドビ 入社早々に総画数84画の漢字を作った話 #源ノ角ゴシック #AdobeFonts | Adobe Blog
    murashit
    murashit 2019/01/23
    言語別の違い参考になる
  • 文化庁指針(漢字のとめ・はねなど)への誤解と早とちり② - マチポンブログ

    文化庁の指針*1に関して、おおよその話は前のブログ記事に書きました。 読んでいない人もいると思いますので、簡単におさらいをしておきます。 文化庁は漢字に関して、以下の説明のような指針を出しました。 漢字の手書き文字について、「はねる」「とめる」など細かい違いで正誤はなく、多様な漢字の形が認められていることを説明する*2 語弊があるかもしれませんが、ごく簡単に言うと「漢字の『とめ』『はね』などを細かく見る必要はない」というものです。漢字の「とめ」「はね」を細かく見る採点は、教師が勝手に作り上げたもので、どこにも根拠がありません。漢字には多様な形があり、どれも正しいものなのです。 では、前回の記事から2年も経ってしまいましたが、このことについて書き損ねた部分や、追加できるところを述べていこうと思います。 指針の2つのベクトル さて、文化庁指針には2つのベクトル(方向性)があると考えています。ブ

    文化庁指針(漢字のとめ・はねなど)への誤解と早とちり② - マチポンブログ
  • 修訂 絹と立方体 : 架空の文字の大図典パブー|電子書籍作成・販売プラットフォーム

    現在修復中です。 下記リンクよりご覧下さい。 google drive 絹と立方体.pdf 102.9 MB https://drive.google.com/file/d/1JkPqfT5HqzZNSCOAO6Ohii2KGEThv0wm/view?usp=sharing 第16回 日トンデモ大賞 特別賞 受賞 柳河二笑亭選書 ; 5 編著者:木村 守一 (福岡県柳川市) 発行:ニコラ・フラメル金属材料研究所 協力:周辺言語学会文字学分室、聖ルミエール教会司書官事務室、manus scribens 2006年12月12日発行 電子版 ver 1.00 2018/02/22 編著者の希望により無料公開します。 連絡は、代理人Twitter @skuldgoddess まで。 webで読むのが最も綺麗なようです。 ”修订版 丝与立方体:'虚构文字'大图典” 书将应编辑的要求,免费出版。

    修訂 絹と立方体 : 架空の文字の大図典パブー|電子書籍作成・販売プラットフォーム
    murashit
    murashit 2018/05/09
    すげえ
  • モヤイ像の絵文字の話

    https://turingcomplete.fm/12 を聞いていて、モヤイ像について昔ちょっと調べたのを思い出したので掘り起こしてみる。 Unicodeに収録された絵文字のなかに「モヤイ像」というものがある。これ、モアイ像ではなくて “Japanese stone statue like Moai on Easter Island”、つまり「イースター島にあるモアイ像みたいな日の石像」として定義されている。ちなみにモアイ像の絵文字というものはないのであった。マジで? マジで。 モヤイ像というのは東京の渋谷駅のランドマークになっているアレであって(細かく言うと色々あるのだがそれについては後述)、イースター島のモアイ像とは似せたようなかんじであってもまあ違う。髪もあるし。上述リンクの図像もまさに渋谷のモヤイ像のような見た目になっている。どうしてこんなことになっているのだろうか? いっぽう

    モヤイ像の絵文字の話
    murashit
    murashit 2018/04/16
    いい……
  • 🖼 グリフを鑑賞する - みずぴー日記

    技術書典に出すのために文字について調べていたらいつのまにか、グリフを鑑賞するアプリを作っていた。柿(かき)と杮(こけら)のような見比べると楽しい文字が次々と表示される。 ✨鑑賞場所 試す: https://mzp.jp/moji/ ソースコード: https://github.com/mzp/moji/ 🖼おすすめの文字 由来が同じ文字 ギリシャ文字を元にラテン文字やキリル文字が作られた、みたいな由来により形状が似ている文字。別の文字と言うのかよくわからないが、Unicodeのコードポイントが別なので別の文字だということにした。 絵文字にもヒエログリフにもブタがいる、みたいな発見もあっておもしろい。 2000年くらいかけてブタがかわいくなった。 形が似ている漢字 柿(かき)と杮(こけら)のように形が似ている漢字。 部首や画数がそろっているせいか、Unicodeのコードポイントが連続して

    🖼 グリフを鑑賞する - みずぴー日記
    murashit
    murashit 2018/03/19
    いい……
  • 現在のUnicodeモンゴル文字の問題点と最近の動き - にせねこメモ

    モンゴル文字は、主にモンゴル語表記のための文字*1である。縦書き専用の文字であり、日語の場合とは反対に左から右へと行を進める。また、アラビア文字のように続け書きされ、文字が語のどの位置に来るかによって形が変わる。 モンゴル文字は現在も中国の内モンゴル自治区でモンゴル語の表記に現役で使用されている。他方モンゴル国ではソ連の影響下でモンゴル語の表記をキリル文字に切り替えたので、モンゴル文字は学校で習いはするものの一般にあまり使われない。 Unicode 3.0からモンゴル文字がシベ文字・トド文字・満州文字と統合されて収録されているため、コンピュータでこの文字を入力するにあたっては、独自の符号化方式を作成するのでなければUnicodeを利用しようとするのが当然に思える。しかし、現状のUnicodeモンゴル文字は致命的な欠陥を抱えている。 このエントリでは、2017年ころからUnicode Te

    現在のUnicodeモンゴル文字の問題点と最近の動き - にせねこメモ
  • プレス発表 「文字情報基盤整備事業」で推進していた漢字6万文字の国際規格化が完了:IPA 独立行政法人 情報処理推進機構

    IPA(独立行政法人情報処理推進機構、理事長:富田 達夫)国際標準推進センターは、2010年9月から推進していた「文字情報基盤整備事業」において、漢字6万文字の国際規格化が完了したことを発表します。これは、ISO(国際標準化機構)より文字コード国際規格の第5版の発行を受けてのことです。 IPAでは、内閣官房IT総合戦略室、経済産業省と共に、「文字情報基盤整備事業」を2010年9月より推進してきました。この事業は、行政の実務で求められる人名や地名等の正確な表記をコンピュータで可能にするため、約6万文字の漢字について、文字フォントの整備や文字コードの国際規格化等を行ってきたものです。なお、国際規格化にあたっては、一般社団法人 情報処理学会 情報規格調査会SC2専門委員会と連携し、順次進めてきました。 12月22日(日時間)、文字コード国際規格書の最新版である、ISO/IEC 10646 (U

  • 絵文字を支える技術の紹介 - Qiita

    絵文字を扱う上で知っておくと良いかもしれないことをまとめてみました。 Ruiさんの記事を見て、「EmojiはSurrogate Pair以外にも、色々とおもしろい技術があるんですよ〜」思って書いてみました。 なお、書いた人はAndroidの人間なので、特に表記していない場合は主にAndroid上での動作のことを書いてます。 またQiita初めてなので読みにくい部分等がありましてもご容赦ください。 サロゲートペア(Surrogate Pairs) このエントリーを書くきっかけにもなったサロゲートペア。なぜこれが導入されたかの経緯は、Ruiさんのブログエントリーに譲るとして、技術的な解説をします。 サロゲートペアは、U+0000..U+FFFFに収まりきらなかった範囲のUnicodeコードポイント(U+10000..U+10FFFF)を、なんとか16bitでエンコードしようとして導入されました

    絵文字を支える技術の紹介 - Qiita