タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
今回は「異体字」についてお話しします。すこし専門的な部分もあるので、適宜不要な部分は読み飛ばすことをお勧めします。 こんな問題から始めてみましょう。世田谷区の区章とその説明文は以下のように書かれています。 外輪の円は区内の平和、中心は「世」の文字が三方に広がり、人びとの協力と区の発展を意味しています。(世田谷区の紋章、シンボル | 世田谷区ホームページより) 「中心は『世』の文字」とありますが、そうは見えません。なぜこのような形なのでしょうか。 前回の記事 本記事は連載形式で、前回の補足のような内容になっています。前回の記事もご参照ください。 shokaki.hatenablog.jp クリックで目次の表示/非表示 前回の記事 異体字とは 異体字の認識 異体字の使われ方 どこまでが同じ漢字か 誤字か異体字か 異体字はどうできるのか よく使う字は略字化する 画数の多い字は正確でなくても読める
ミサンザイ 同人誌 「天皇を旅する本」「天皇を旅する地図」ほか BOOTHはじめました @katsunomisanzai 天皇陵や大嘗祭斎田を探訪したり、天皇が登場するマンガを読みくらべて描かれ方を調べたり、ローカルな皇族伝説やご落胤伝説が残る場所を訪ねたり…天皇にまつわることを全方位的に探求。同人誌『天皇を旅する本』1〜3号とらのあなで委託販売中。BOOTHもはじめました。 misanzai.booth.pm ミサンザイ 同人誌 「天皇を旅する本」「天皇を旅する地図」ほか BOOTHはじめました @katsunomisanzai 治安がよくないねと妻がいってたのだけど、しかしこの落書き筆の運びがとてもなめらかだし「田町」とか異体字つかってるし、もしかしてかなり書の素養のあるヤンキーがかいたのでは… pic.twitter.com/m6Qa7XMpfK 2023-12-15 19:35:2
Unicodeの異体字セレクター(variation selectors)を使い、ユニコード文字列内に隠し情報を埋め込む方法です。 異体字セレクターとは 異体字セレクターは、文字の字体を詳細に指定するモディファイアのようなもの 異体字セレクターは16種類のコードポイントがある(FE00~FE0F) 仕組みの概要 隠したい文字列(hidden)を文字単位にバラす (例: js → j, s) 文字ごとに16進数に変換する (例: j → 6A) その16進数をひと桁ずつ異体字セレクターのコードポイントにマッピングする (例: 6→FE06, A → FE0A) 異体字セレクターの配列をひとつの文字列にまとめなおす 最後にそれを埋め込み先の文字列(body)に混ぜ込んで隠す。 よくあるユニコードステガノグラフィーとの違い ゼロ幅文字を使ったステガノグラフィー 次のようなゼロ幅空白文字を用いたス
本記事は 【Advent Calendar 2023】 17日目の記事です。 🎄 16日目 ▶▶ 本記事 ▶▶ 18日目 🎅 こんにちは。 2年目の草野です。年末が近づいてきましたね。 今回はAdvent Calendarの執筆に参加ということで、2023年の業務の中で印象深かったUnicodeについて少しお話したいと思います。 そもそもUnicodeとは サロゲートペア文字 突然ですが…… 異体字セレクタとの出会い 異体字セレクタって? 全く同じ意味を持つ文字、異体字 異体字セレクタの誕生 具体例 結局私の名字はどう書くの? おわりに そもそもUnicodeとは みなさんご存じの通り、Unicodeは文字を表すための国際的な標準規格の1つです。 一般的には [U+91CE] のように、16進数で表記されます。 常用文字は [U+0000] ~ [U+FFFF] の16進数4文字=2バ
ここも考慮すると 斎藤 と書くと 69.3% 正解で、 斉藤 と書くと 30.7% 正解になります。 また子供のころに 斎 が難しかったので 斉 と書いていたケースも考えると、この二つの差は少し縮まりまるかもしれません。 とりあえず確立論的には 斎 と書けば…なんとなく、あたるかも…しれない? (ちゃんと本人に確認とりましょう!!!) 斉 | 法務省 戸籍統一文字情報 詳細表示 の正字 斎 | 法務省 戸籍統一文字情報 詳細表示 の正字 人数情報 「斎藤」「斉藤」「齋藤」「齊藤」・・この差って何? | 東洋経済オンライン 拝啓 斎藤さん 先日エンジニアとしてサイトウさんが入社したときに「サイトウのサイってどう書きますか…? Unicodeで教えてください。」という、いつものあれが発生したのでそろそろサイトウについて理解してみようと思いました。 また以前に 『異体字の世界”ワタナベ”』| 漢
いまだに Emacs を使ってるんだけど、最近フォント周りを調べてみたのでメモ。 異体字セレクタ Emacs は異体字セレクタに対応してないとずっと思っていたんだけど、実は単にフォントの問題で、ちゃんと異体字セレクタに対応したフォントを使えば異体字を表示することができた。 普段使ってる Migu 1M フォントだと Emacs 上で異体字はこんな感じに表示される。 異体字セレクタに対応している花園明朝Aフォントを使うとちゃんと表示できる。 でも明朝体ではなくゴシック体を使いたい。IPAexゴシックフォントは一部しか異体字セレクタに対応していない。「禰󠄀豆子」は表示できるけど「令󠄂和」は表示できない。 全体的に Migu 1M フォントを使いつつ、「令」(U+4EE4)は花園明朝A、「禰」(U+79B0)はIPAexゴシックを使うということもできる。 (set-fontset-font
独立行政法人国立文化財機構 東京文化財研究所 日本語 English MENU メニューを飛ばす 異体字リスト HOME » 異体字リスト 対象となる異体字を検索することができます。 検索文字対象の異体字 皑皑 皚皚皚 凒 皑蔼蔼 藹藹藹 譪 蔼霭霭 謁 靄靄靄 謁 霭爱爱 愛愛愛 㤅 爱暧暧 曖曖曖 暧谙谙 諳諳諳 谙鏖鏖 鏕 鏖鳌鳌 鼇 鰲鰲鰲 鼇 鳌媪媪 媼媼媼 媪拔拔 抜抜抜 杮 叐 㧞 拔罢罢 罷罷罷 羆 罴 罢摆摆 襬 擺擺擺 捭 㪏 摆呗呗 唄唄唄 㗑 呗败败 敗敗敗 䢙 贁 败颁颁 頒頒頒 朌 攽 䫞 颁钣钣 版 鈑鈑鈑 版 钣绊绊 絆絆絆 靽 绊帮帮 幫 幇幇幇 鞤 縍 䩷 㿶 㨍 幚 幫 帮谤谤 謗謗謗 谤鸨鸨 鴇鴇鴇 鳵 駂 䳰 䳈 鸨饱饱 飽飽飽 飹 䭋 饱报报 報報報 报鲍鲍 鮑鮑鮑 蚫 鲍鹎鹎 鵯鵯鵯 鹎贝贝 貝貝貝 蛽 贝辈辈 輩輩輩 軰 辈狈狈 狽狽狽 䟺
Kotlin / Swift での Unicode の扱いまとめ (見た目上の文字数カウント, UTF-8, UTF-16, BOM, 正規化, 異体字セレクタ)AndroidiOSKotlinUnicodeSwift Kotlin と Swift での見た目上の文字数カウント実装を中心に、Unicode について知っておくべき知識をまとめます。 また、モバイルアプリで入力文字数のカウントや入力文字数の上限をどのように扱うかは以下の別の記事にまとめました。 文字数カウント まずは、文字数カウントが難しい例として絵文字と異体字セレクタ表現の例を挙げます。詳しい説明はこの記事の後半を確認してください。 絵文字 🧑🦰 の文字数について確認します。🧑🦰 は以下の Unicode で構成されています。 文字 Code point UTF-8 表現 UTF-16 表現 Descriptio
DSOC Data Management Group*1 の三原です。 2020年2月4日、多くのご要望をいただき個人的にも念願であった、Sansanサービスにおける「氏名の異体字入力」がついにリリースされたため、ご紹介させていただきます。 Sansanではこれまで、スキャンされた名刺の氏名に異体字*2が含まれていた場合、該当する文字は「●」と表示される仕様となっていました。たとえば、はしごだかを含んだ「髙橋たろう」という氏名であれば「●橋たろう」となります。それが今回のリリースにより氏名がそのまま「髙橋たろう」と表示できるようになりました。 以下で詳しく説明していきます。 異体字対応の背景 前述したとおり、これまでは氏名の異体字に該当する文字は「●」で表示するというサービス仕様になっていました。 土に口のいわゆるこの つちよし は「●田」に置き換えていたわけです。 「●」と表示する仕様だ
今回は、Word文書に「異体字」を入力する方法を紹介していこう。人名や地名を正しい漢字で入力したい場合などに参考にして頂ければ幸いだ。ただし、すべての字体がサポートされている訳ではないので、この方法だけで問題を解決できるとは限らない。 異体字とは? 「異体字」とは、同じ漢字であるが、文字の一部(または大部分)の書き方が異なる漢字のことを指す。たとえば「辻」(つじ)という漢字には、「しんにょう」の点が2つあるものと、1つしかないのものの2種類の字体がある。 異体字の例-1 もちろん、このほかにも異体字がある漢字はいくつも存在する。たとえば、「鯖」や「葛」、「榊」、「斉」には、以下のような字体が用意されている。 異体字の例-2 IMEパッドを使った異体字の入力 それでは、Wordに異体字を入力する方法を紹介していこう。ここでは、先ほど紹介した「辻」を例にして異体字の入力手順を解説する。 Win
前回に引き続き、今回も「異体字」について解説していこう。わずかな字体の変化にも対応できるようにするには、多くの字体を収録したフォントを使用しなければならない。ここでは「IPAmj明朝」というフォントを使って異体字を入力する方法を紹介してみよう。 「IPAmj明朝」とは? 「IPAmj明朝」は独立行政法人 情報処理推進機構(IPA)が配布している日本語フォントで、約6万文字もの字体を収録しているフォントとなる。このフォントを使うと、氏名に使われる漢字などを「正確な字体」で再現することが可能となる。商用/非商用にかかわらず、誰でも無料で使えるフォントなので、気になる方は試してみるとよいだろう。 まずは、情報処理推進機構のWebサイトを開き、「フォント」の項目をクリックする。 情報処理推進機構のWebサイト すると、「IPAmj明朝」の利用条件などが記されたWebページが表示される。「IPAmj
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く