タグ

漢字に関するkyo_agoのブックマーク (14)

  • マイナンバーカード作成時に氏名の常用漢字「樹」が代替文字になる問題

    重い腰を上げマイナンバーカードを作成しようと申請したところ、気になることが発生しました。 代替文字とはなんでしょうか。 署名用電子証明書は、コンピュータで使用されるものであるため、氏名、住所は、文字化けせずにコンピュータで表示されるものとする必要があります。このため署名用電子証明書で利用可能な文字は、JIS(日工業規格)の漢字の規格の内、日常的に使用頻度の高い常用漢字と人名用漢字を含むJIS第一水準、第二水準(JISX0208)と補助漢字(JISX0212)の範囲としています。 住民基台帳の氏名または住所が電子証明書に記載するコード取扱範囲外の場合は、コンピュータでの表示に類似の字形を指定し、代替文字として登録します。(公的個人認証サービスポータルサイトより) 平たく言えば、「パソコンで普通に打てない名前は置き換えるよ」という意味です。 名字が旧字体で変換しても出てこない人も多いでしょ

    マイナンバーカード作成時に氏名の常用漢字「樹」が代替文字になる問題
  • インデントにタブを使うアクセシビリティ上の利点

    この記事には誰かを攻撃したり差別したりする意図はありません。もし不適切な表現を見つけた場合は修正しますのでご連絡ください。 「インデントにタブとスペースのどちらを使うのか」というのは昔から何度も議論されてきた問題です。 最初に明確にしておきますが、私個人としてはタブを使おうがスペースを使おうが、プロジェクト内で統一されていれば構いません。 しかしタブには、スペースにはないアクセシビリティ上の利点が存在します。 タブの最大の特徴は、表示幅を自由に設定できることです。 ご存知のとおり、一つのタブに対して実際の見た目としてどのくらいの幅が確保されるかは、テキストエディタなどのコードを閲覧する環境の設定次第です。 たとえば、GitHub は一つのタブをデフォルトではスペース 8 個分の幅で表示しますが、 https://github.com/settings/appearance から自由に変更で

    インデントにタブを使うアクセシビリティ上の利点
  • AI手書き「手書きくん」 - ロボットがあなたの文字で代筆

    手書きくんは、ロボットがペンを持って誰の文字でも書くことができます。自分で書いた文字を写真で取るだけで、「手書きくん」はあなたの文字を学習します。そして、あなたの文字で手紙を代筆可能です。 印刷のDMと違って手書きの手紙は高い反応率を得ることが可能です。手書きだけでなく、手紙の送付まで行うので全く手間がかからないサービスです。 自分の文字だけでなくペンの師範の文字も学習済みなので、自分の文字で手紙を送りたくない人でも安心です。

  • JavaScriptのIntl.Segmenterで文章の意味分割を行う

    コンピュータ上で文字列を扱う時、データ上は単にコードユニットの羅列でしかなく、そこに単語や文としての意味合いはありません。 しかし我々は人間であり、単なる文字列ではなく文章として処理したい場合があります。そんなとき、 Intl.Segmenter が役に立つかもしれません。 文章の分割と仕様の標準化 プログラムを書く上で、文字列の処理、というより「文章の処理」をしたくなることがしばしばあります。文章というのは単語や文で構成された、単なる文字コードの連続ではなく、人間的に意味を持つ単位が連続したものとなります。 今まで文字列の意味的な分割は Intl.v8BreakIterator を用いて行っていました。これはChromeやNode.jsで使用されているV8エンジンの独自の仕様であり、一般的な物ではありません。なおかつNode.jsでは意図的に無効化されています。 Intl.v8Break

    JavaScriptのIntl.Segmenterで文章の意味分割を行う
  • 本当は恐ろしい「〜」記号 : IT翻訳者Blog

    Yahoo Japanの「新型コロナワクチン情報まとめ」を見ていたら、次の画像があった。 アストラゼネカの行に「有効性 〜76%」とあり(赤枠)、私はここが気になってしまった。 (出典:https://news.yahoo.co.jp/pages/20210122、閲覧:2021-07-02) これを見た人は、普通は「最大で76%」と解釈するだろう。日語で「〜」は「数字の範囲」を示すのが一般的である。例えば共同通信社の『記者ハンドブック』でもその意味で使っている。範囲の右側だけに数字があるので「最大」という解釈になる。最大なのだから、有効性は10%かもしれないし60%かもしれない。 しかし日語の「〜」によく似た英語の「~」(チルダ)には別の意味がある。「約」や「およそ」である。この意味を掲載している辞書は実は少ないのだが、たとえばMerriam-Websterの「tilde」には2bに

    本当は恐ろしい「〜」記号 : IT翻訳者Blog
  • 「阿佐ヶ谷駅」か「阿佐ケ谷駅」か

    読めますか? テーマは〈記号のような漢字〉です。凸起答えとっき(正解率 97%)今は普通「突起」と書くが、昔の小説ではけっこう使われていた。昭和初期の小栗虫太郎「夢殿殺人事件」などに用例が見られる。凸は常用漢字。なお6月6日(20... 漢字の字体の違いなどの場合ですと、「この人の名は沢田さん、あの人の名は澤田さんと書く」といったこともありえます(とはいえ、同じ字なので、原則として新聞では「沢」を使うようにしています)。 しかし、記号を記号っぽく小さくして「ヶ」と書くか、見やすいように大きく「ケ」と書くかは、漢字の字体とは違って「人により」「土地により」というわけにはいきません。新聞としては、どちらかに決めるしかないのです。 混在する「ケ」と「ヶ」 例えば、東京都杉並区阿佐谷南(これはケなし)にあるJRの駅。どう表記しているのか見に行きました。車内の電光表示で「阿佐ケ谷」でしたが、細かい字

    「阿佐ヶ谷駅」か「阿佐ケ谷駅」か
  • シュトヘル達の名前を西夏文字 (Unicode) で書く

    初稿: 2020-10-16 小松弘幸 (@komatsuh) 記事の内容 シュトヘルという漫画がとてもよいです 西夏文字をコンピューター上で扱う方法を紹介します 西夏文字の簡易辞書を作成します シュトヘルの登場人物を西夏文字で表現します ユルール 𘅝𘚻 (U+1815D U+186BB) - 祝福 (慶喜) ハラバル 𗱈𗰞 (U+17C48 U+17C1E) - 黒虎 シュトヘル 𘄅𗾢 (U+18105 U+17FA2) - 雀子 左から順に ユルール ハラバル シュトヘル はじめに この文書に登場する西夏文字を正しく表示するためには、おそらくフォントのインストールが必要です。下記の GitHub などからダウンロードとインストールができます。 Noto fonts: NotoSerifTangut (GitHub) シュトヘルと西夏文字 シュトヘルという漫画を読んでとても好

    シュトヘル達の名前を西夏文字 (Unicode) で書く
  • 外国人に「汁」という漢字が人気らしい→その理由が予想外だった「味噌汁が神々しい」「これぞ神のみそ汁」

    リンク 日経済新聞 電子版 「汁」が十字架に見える!?日語スニーカーの挑戦 都内の電車内で一風変わったデザインのスニーカーが目に飛び込んできた。ナイキのスニーカーのようだが、かかとの赤の縦のラインには「心只為此燃」と表記された漢字。珍しいモデルだ。スマートフォンで調べると2 2 users 23

    外国人に「汁」という漢字が人気らしい→その理由が予想外だった「味噌汁が神々しい」「これぞ神のみそ汁」
  • 新元号 「令」の字に複数の形 どれが本当? | NHKニュース

    新しい元号の「令和」の「令」の字は、パソコンなどの書体によって字の形が異なることから、書体を開発している会社では、顧客からの問い合わせへの対応について検討を始めています。一方、文化庁は正解や決まりはないと話しています。 主に▼3画目が横棒、5画目が縦棒とする書き方と、 ▼3画目も5画目も斜めの点のようにする場合があるということです。 この会社では、およそ1500種類の書体を取り扱っていて、新しい元号の発表を受けて、書体のデザイン担当の社員たちが集まり、「令」の字が書体によってどのように異なるか確認していました。 そのうえで、顧客から問い合わせがあった場合の対応について、形は異なっても同じ字なので問題ないことを説明することや選択できるようにしたいという要望があった場合には、特注で対応が可能なのかといったことについて検討を始めていました。 書体を開発する「モリサワ」のフォントデザイン部の阪

    新元号 「令」の字に複数の形 どれが本当? | NHKニュース
  • アドビ 入社早々に総画数84画の漢字を作った話 #源ノ角ゴシック #AdobeFonts | Adobe Blog

    こんにちは!アドビのタイプデザイナーの吉田です。 昨年の4月に入社して間もなく、チーフデザイナーの西塚涼子さんからある漢字制作をまかされました。今回はその貴重な体験を執筆させていただこうと思います。 源ノ角ゴシックのアップデート それは源ノ角ゴシックのアップデートに伴うグリフの制作でした。源ノ角ゴシック2.0にとんでもない画数の漢字が追加されることは分かっていたのですが、まさかそれを自分が作ることになるとは思いませんでした。そう、ご存知の方もいらっしゃると思いますが、そのとんでもない画数の漢字とは「たいと/おとど」のことです。この漢字は、昔人名漢字として使われていたと一説には言われています。外見は複雑なようで単純明快「雲・雲・龍・雲・龍・龍」と、単体としても画数が多い漢字6つが1つの漢字の中に押し込められています。以前、源ノ明朝のリリースで「ビャン」という漢字が追加されたことを覚えています

    アドビ 入社早々に総画数84画の漢字を作った話 #源ノ角ゴシック #AdobeFonts | Adobe Blog
  • JIS漢字に紛れ込んだ「幽霊文字」

    語の一般的な表記や地名、人名などで用いられる漢字をコンピューターなどで扱うため、1978年に最初の規格「JIS C 6226」が制定されました。この時点で、世界最大の漢和辞典「大漢和辭典」、および収録字数が多い「新字源」のいずれにも見当たらない幽霊文字が混入していました。その後、第4次規格の作成時に徹底した調査が行われて、いくつかの文字については由来が判明しましたが、なおも12文字が幽霊文字として残っています。 幽霊文字 - Wikipedia https://ja.wikipedia.org/wiki/%E5%B9%BD%E9%9C%8A%E6%96%87%E5%AD%97 A Spectre is Haunting Unicode https://www.dampfkraft.com/ghost-characters.html 幽霊文字として残っている12文字をJIS規格の区点順に

    JIS漢字に紛れ込んだ「幽霊文字」
  • キラキラネーム読解術

    https://anond.hatelabo.jp/20170819083313 塾講師なのでキラキラネーム読解にはかなりの自信がある。 そんな私に言わせれば、羽奏=わかなはまだ標準レベル。 なのでみんな読めたほうがいいんじゃないか。 こういう名付けの是非についてはいろいろ議論もあろうかと思うが、今後キラキラネーム勢が社会に進出してくることは確実なので、この程度が読めないようでは老害の烙印を押されることは必至。 というわけで、以下の原則をマスターしてキミもキラキラネームマスターになろう! 大半のキラキラネームは意外に常識的だと心得るキラキラネームには大きく2つのパターンがある。 ①読みは普通だが漢字の当て方が変 ②漢字の当て方は普通だが読みが変 「羽奏」のばあい、読みの「わかな」は普通なので①というわけ。 ①+②の最終形態になるともはやどうしようもないが、①か②のどっちか片方である=読みか

    キラキラネーム読解術
  • 漢字の「一」「二」「三」の次がいきなり「四」になるのはなぜなのか?

    一、二、三、…………四。なんでだよ。 「四」という字の形、冷静に見返してみると不思議です。横棒1で一。2で二、3で三。ここまではいいのに、なぜかいきなりの「四」。 ということで、今回は漢数字「四」の謎について調べてみました。 そもそも「一二三」が分かりやすいのだ まずは一、二、三についての成り立ちを漢字辞典で調べてみましょう。すると、「横線の数で数字を表した漢字である」ということが分かります。そりゃあそうだ。 このように、概念を図形的に説明した漢字の作り方を「指事」といいます。 例えば、「↑」を表す漢字は、まず基準線となる横棒を書き、「それより高い」ことを示すために、線の上に書き足して「上」。「↓」は逆の手順で「下」。 このような指事の考え方のもと、「数字の1という概念」は「横線1」で表せる、ということで漢字の「一」が生まれました(最初に漢字を作った人がそこまで細かく考えたのかは分

    漢字の「一」「二」「三」の次がいきなり「四」になるのはなぜなのか?
  • 6万種の漢字異体字を扱えるフォントを公開

    文字情報技術促進協議会が「IPAmjPUPフォントVersion 001.01」を公開。IPAが整備した約6万種の漢字の異体字を外字を使わずに扱える。 文字情報技術促進協議会は2015年11月17日、情報処理推進機構(IPA)が推進する「文字情報基盤導入テクニカルスタディ」に定められている「文字情報基盤暫定私用コード1」に沿ったマッピングテーブルと対応フォントIPAmjPUPフォントVersion 001.01」を公開した。「IPAフォントライセンスv1.0」に基づき配布する。 同フォントは、異体字を区別するのにIVS(後述)が必要な文字と「ISO/IEC 10646」で符号化が完了していない文字を、既存のIPAmj明朝フォントに対して、文字情報基盤「暫定私用コード1」の符号位置に追加実装したもの。文字情報基盤が整備した約6万種の漢字の異体字全てを、外字を使わずに扱える。 IPAは、国や

    6万種の漢字異体字を扱えるフォントを公開
  • 1