並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 137件

新着順 人気順

異体字の検索結果1 - 40 件 / 137件

  • フリーのフォントで最強は何よ:哲学ニュースnwk

    2011年02月22日14:20 フリーのフォントで最強は何よ Tweet 1: ケズリス(中部地方):2011/02/20(日) 17:14:38.72 ID:NsTw1bOu0 膨大な異体字を含む漢字約8万字を収録したフリーのTrueTypeフォント「Tフォント」 明朝体・ゴシック体・楷書体の漢字を各78,675字収録 http://www.forest.impress.co.jp/docs/review/20110218_427596.html 「Tフォント」2011-01版  「Tフォント」は、膨大な異体字を含む78,675字を収録した 明朝体・ゴシック体・楷書体のTrueTypeフォント。 Windowsなどに対応するフリーソフトで、現在国産OS開発プロジェクト “TRONプロジェクト”のうち、文字コード の管理および普及促進を行う機関“TRON文字収録センター”の Webサイ

    • 「本醸造の醤油が当たり前になったのはここ20年ぐらい」と言っていいのは今から30年前 - 醤油手帖

      ※現在は修正が入りました! 迅速な対応に感謝します(2020/10/06追記) 醤油が大好きな人としては歴史改ざんなんてされてはたまらないという事例がありました。2020年9月30日に朝日新聞のサイトで公開されたこちらの記事です。 www.asahi.com 10月3日にはYahoo!に掲載されて、より多くの人が読むようになりました。そこで「本当なの?」と問い合わせがきてとんでもない記事に気がついた次第です。 news.yahoo.co.jp 一体何が問題なのか。 それは最初の章の以下の部分です。 戦時中に大豆の供給が逼迫(ひっぱく)して、その代替品としてカイコのさなぎ、しかも油を採取したあとの搾り粕(かす)から醬油(しょうゆ)が作られたことを知ったときは衝撃でした。さらにその後、アミノ酸液に味つけしただけの化学的な『アミノ酸醬油』が出回るようになり、醬油が本来の味を取り戻すには長い時間が

        「本醸造の醤油が当たり前になったのはここ20年ぐらい」と言っていいのは今から30年前 - 醤油手帖
      • UnicodeとUTF-8の違いは? - Humanity

        という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

          UnicodeとUTF-8の違いは? - Humanity
        • 文字コード | 衆議院議員 河野太郎公式サイト

          2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日本語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。 ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55,270文字もあります。 全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を2011年に策定し、それにあわせたフォントを作成し、無償で提供しています。 この「文字情報基盤」(MJ)には、58,862文字が含まれています。 しかし、このMJを全庁的に採用している自治体は、川口

            文字コード | 衆議院議員 河野太郎公式サイト
          • 漢字部屋 - 凄い漢字

            サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは本日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

            • JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io

              Intro textarea などに入力された文字数を、 JS で数えたい場合がある。 ここで .length を数えるだけではダメな理由は、文字コードや JS の内部表現の話を理解する必要がある。 多言語や絵文字対応なども踏まえた上で、どう処理するべきなのか。 それ自体は枯れた話題ではあるが、近年 ECMAScript に追加された機能などを交えて解説する。 なお、文字コードの仕組みを詳解すること自体が目的では無いため、 BOM, UCS-2, Endian, 歴史的経緯など、この手の話題につき物な話の一部は省くこととする。 1 文字とは何か Unicode は全ての文字に ID を振ることを目的としている。 例えば 😭 (loudly crying face) なら 0x1F62D だ。 1 つの文字に 1 つの ID が割り当てられているのだから、文字の数を数える場合は、この ID

                JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io
              • C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita

                Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? C++ Advent Calendar 2018 この記事はC++ Advent Calendar 2018 15日目の記事です。 14日目: VTKライブラリ 16日目: C++のエラー処理との付き合い方 当初見積もりよりも大幅に長い記事となり、投稿したのは12/22で1週間遅刻です。すみません。 お知らせ cpprefjpにchar8_t型追加について解説を書きました。ぎゅぎゅっとコンパクトに、また査読を受けて中立的な表現で書いていますので、よければどうぞ。 UTF-8エンコーディングされた文字の型としてchar8_tを追加 - c

                  C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita
                • 化学を「ばけがく」と読むみたいな言葉一覧・完全版

                  科学と化学が、同じようなシーンで使うのに、どっちも「かがく」という読みであり、伝えにくい……こういうことって、よくありますよね。 でも、大丈夫。化学の方を「ばけがく」とわざと読む読み方があるんです! これは便利! こういう言葉って他にどんなのがあるのか気になったので、調べてみた。 「説明読み」と言われているらしい 化学と科学が紛らわしいので、化学の化をわざと訓読みして、ばけがくと読むみたいな言葉。ウィキペディアを調べると「説明読み」と呼ばれているらしい。(武部良明「二字漢字語の音訓読み分けについて」) 正しい読みかたではないけれど、紛らわしさをさけるため、わざと読みを変える。 すぐ思いつくのは、私立と市立の読み分け。私立を「わたくしりつ」、市立を「いちりつ」と読み替える例だろう。 テレビのニュースなどでは、なんの説明もなく「わたくしりつの学校で〜」というふうに普通に読み上げるので、もはやこ

                    化学を「ばけがく」と読むみたいな言葉一覧・完全版
                  • 「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記

                    自分の知らないCJK Ideographのバリエーションがまだあったことに戦慄している pic.twitter.com/kUlyRLDDTM— moriyoshit (@moriyoshit) March 9, 2017 などというツイートをしたところ、思ったより反響があったのでまとめておく。 上記ではあいまいに「バリエーション」などと書いたが、Unicodeとそれを扱う環境においては、バリエーションと一口に言っても次のような状況がある。 意味論的に等価な異なる字形の集合 同じ字形で異なるコードポイントの集合 aは結構なじみ深いと思う。 a-1. 異なるコードポイントにそれぞれ異なる字形が割り当てられているもの 例: 「東」(U+6771) ⇔「东」(U+4E1C) 「斉」(U+6589) ⇔「齊」(U+9F4A) 「高」(U+9AD8) ⇔「髙」(U+9AD9) a-2. 同じコードポイ

                      「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記
                    • コンピューターで全漢字使用可に 6万字コード化 | NHKニュース

                      日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。 このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進め

                        コンピューターで全漢字使用可に 6万字コード化 | NHKニュース
                      • OS X El Capitan(10.11.2)搭載のヒラギノフォントと弊社製品版フォントについて|ヒラギノサポート

                        OS X El Capitan(10.11.2)搭載のヒラギノフォントと 弊社製品版フォントについて 2015年12月11日掲載 平素は弊社製品をご愛顧頂き、誠にありがとうございます。 Apple社からリリースされた「OS X El Capitan 10.11.2(以下「OS X 10.11.2」という)」に搭載のヒラギノフォントと「製品版/従来版フォント(※)」との互換性、使用上の注意点などをご説明いたします。 ※製品版/従来版フォント:弊社製品版、MORISAWA PASSPORT製品版、OS X 10.7~10.10搭載版 <OS X 10.11.2の変更点> OS X 10.11.2にて、OS X 10.11~10.11.1で発生していた非互換項目のうち、最も深刻な「異体字テーブルの不具合」が修正されました。 これにより深刻な不具合は解消しましたが、製品版/従来版フォントとは濁点の

                        • 絵文字を支える技術について|nona

                          はじめにこちらはmhidakaが建立したAdvent Calendar Day.3となります。 こんにちは、はじめまして、のなと申します。mhidakaさんのTweetを見つけて、初めてAdvent Calendarなるものを書いています。なにかお作法間違っていたら大目に見てください、よろしくお願いします。 軽く自己紹介をさせていただくと、普段はGoogleでAndroidのTextまわりの開発を行っており、DroidKaigiやShibuya APKで発表させていただいたりしています。最近はほぼ絵文字の話しかしてないので、絵文字おじさんと思われてそうですが、普段の仕事は絵文字に限らず、Androidの文字表示の部分は大抵面倒をみています。 今回この機会をいただいたので、どんな内容を書こうか迷ったのですが、やはり皆が読んで面白い内容というと、絵文字になるのかなぁ、ということで性懲りもなく絵

                            絵文字を支える技術について|nona
                          • 基本4情報での名寄せは難しい|MORIDaisuke

                            先日は住所の件でお楽しみでしたね。 私も楽しくなってしょうもないツイートをしたところ、@masanorkさんから有用な情報をいただいてしまいました。 異体字に加えて外字も根深いですし、日付型に収まらない住基の生年月日とか、屋号を含んだ個人事業主の口座名義とか、外国人氏名における住民登録のアルファベットと口座名義のカタカナとの解離とか、旧姓併記の例外処理とか、文字列型に刻まれたバッドノウハウの塊ですね https://t.co/GOaytijfst — Masanori Kusunoki / 楠 正憲 (@masanork) June 6, 2023 このとき、私はごく簡単な「名寄せの難しさ」の社内研修資料を作っている最中だったのですが、この情報が大変参考になりました。 一方、私だけが得をしているのがなんとなくムズムズしてきたので、ここにアウトプットしてスッキリしようと思います。 なお、住所

                              基本4情報での名寄せは難しい|MORIDaisuke
                            • 日本における「名寄せ」と「照合」の黒歴史

                              健康保険証、銀行口座、年金記録――個人のマイナンバーに別人の情報がひも付けられるトラブルが後を絶たない。多くの事案に共通するのは、自治体や関係機関の職員が氏名や生年月日などを基にマイナンバーや住民データを照会した際に、誤って同姓同名の人の情報を引き出してひも付けてしまうというケースだ。 こうした情報のひも付けをする際、職員が住民データの照合や突合、本人確認に使うのが「氏名」「生年月日」「性別」「住所」、いわゆる基本4情報といわれるものだ。 だがこの4情報は、コンピューターによる自動処理とは絶望的に相性が悪い。例えば氏名は「邊」「邉」など旧字・異体字の揺らぎや外字の処理が煩雑なうえ、婚姻による改名もある。よくある氏名の場合、氏名も生年月日も同一というケースが頻発する。住所は時期によって変わるうえ、人によって書き方が「一丁目四番」から「1―4」まで一意ではない。 こうした曖昧な識別符号を代替す

                                日本における「名寄せ」と「照合」の黒歴史
                              • カオスちゃんねる : 「捗る」のつくりは「歩」じゃないことが判明

                                2022年05月27日22:00 「捗る」のつくりは「歩」じゃないことが判明 過去のおすすめ記事の再掲です 1 名前:以下、名無しにかわりましてVIPがお送りします[] 投稿日:2012/11/24(土) 22:25:03.01 ID:qsGl/zKf0 よくみたらシュッ!が足りない 2 名前:以下、名無しにかわりましてVIPがお送りします[] 投稿日:2012/11/24(土) 22:25:25.14 ID:PsxyPS370 ホンマや・・・ 3 名前:以下、名無しにかわりましてVIPがお送りします[] 投稿日:2012/11/24(土) 22:26:21.84 ID:pAyFsdiV0 マジだった… 6 名前:以下、名無しにかわりましてVIPがお送りします[] 投稿日:2012/11/24(土) 22:26:51.43 ID:kxWM1BlG0 うそん・・・ 7 名前:以下、名無しにか

                                • IPAが無償で提供している文字の検索システムがなかなかイケていると話題に/関連する文字をグラフで表示。異体字の一覧も可能【やじうまの杜】

                                    IPAが無償で提供している文字の検索システムがなかなかイケていると話題に/関連する文字をグラフで表示。異体字の一覧も可能【やじうまの杜】
                                  • ゟ | だストレージ

                                    先ずはこの『ゟ』という文字がキチンと表示されているかどうかが不安である。 まあよほど古いPC等でない限り大丈夫とは思うが……。 ある程度高い年代の方々や出版・図書・報道などの業界にいる人、一部の研究者や特定分野の趣味人にとっては馴染みがある文字かもしれない。 ※追記:本文中の「ゟ」にもWebフォントで『筑紫明朝』を適用しました。こんな特殊な文字もバッチリ表示される…! FONTPLUSさんありがたい。 I have a よ. I have a り. そもそも私がこれを全く読めなくて調べたことから始まってしまう。 正直、初見はどこか外国語のアルファベットかサンスクリットの文字か何かかと思った……。 これは、2つ以上の平仮名や片仮名などを組み合わせた文字で、『合字』や『合略仮名』と呼ばれるものの一つである。 読みは「より」であり、そのまま平仮名の「よ」と「り」の合字だ。※1 手紙の差出人名や起

                                      ゟ | だストレージ
                                    • 『戸籍統一文字』の見たことない漢字はいったいなに?

                                      法務省が、戸籍で取り扱う文字を整理した「戸籍統一文字」を検索できるウェブサイト「戸籍統一文字情報」で、漢字を検索すると、みたことのない漢字がゾロゾロでてきて、たいへんおもしろい。 当サイトでは、昨年動画で取り上げたうえに、記事化までしていじり倒してきた。 この、みたことのない漢字をいじっておもしろがるのは、それはそれでいいけれど、やはり「なんでこんな漢字があるのか」という、素朴な疑問も当然わく。 そこで、漢字に詳しいひとと一緒に、戸籍統一文字にある不思議な文字を一緒にみてもらうことにした。 「戸籍統一文字」とは? 日本語を話す日本人が普段使うとされている漢字は、常用漢字としてまとめられており、その数は現在2136文字ある。 そのほか、めったに見かけないけれど、読んだり書いたりできる漢字。読み方もわからないけれど、どこかで使われている漢字をあわせて、かなり多めに見積もっても、おそらく3000

                                        『戸籍統一文字』の見たことない漢字はいったいなに?
                                      • 日本語入力について - アスペ日記

                                        私が日本語入力について思っていることを書いてみる。 自分としては、デフォルト以外の日本語入力システムとして、ATOK と Google 日本語入力ぐらい(まあ、Baidu IME とかもあるが)しかないのが心の底から残念でたまらない。 雑誌の特集などで、Google 日本語入力と ATOK に単語や文章を変換させて精度を比較しているものを見かける。まあ総合的には同じぐらいの結果になっている。だが、実際に長い間使っているとわかるのだが、Google 日本語入力の間違え方のほうが「理不尽」なのだ。どうしてこれがこうなる? と思わず言いたくなるような。その点、ATOK は弱い部分が前もってわかる。アニメやゲームなど、マニアックな変換には弱い。しかし、ATOK である程度日本語の文章を打ち慣れた人にとっては、そういう「難しいだろうな」と思うようなところは、打つ前からそのことがわかるものだ。 ATO

                                          日本語入力について - アスペ日記
                                        • カッコイイほうの漢字 - アスペ日記

                                          「醱酵」って漢字、見たことあるでしょうか。 「発酵」の別の書き方です。 「日食」「月食」に対する「日蝕」「月蝕」などもあります。 難しい分だけ、かっこいいですよね。 これらの「かっこいいほうの漢字」のことを、ぼんやりと「旧字=本来の字=正しい字」とか思っていたりしませんか? 最近、こういう「かっこいいほう」の漢字を見る機会が増えました。 マイナーなところでは、「○○年 没」を「○○年 歿」とか、「麻痺」を「痲痺」なんていうものもあります。 まあ、スタイルとしてならそれもいいでしょう。 私も中学校ぐらいのころは旧漢字の練習をしたりしていました。 でも、中二あたりを過ぎた大人で、上に挙げたようなものを「正しい」とか言っちゃってる人がいたら、恥ずかしい人ですので大いに笑ってあげてください。 (ところで、ここでは「嗤う」が正しいとか思ってしまうような人も「笑い」ものです) この記事を書こうと思った

                                            カッコイイほうの漢字 - アスペ日記
                                          • 「竜」の字体が「龍」よりも古いというトンデモについて|nkay

                                            楷書の「龍」という形は殷墟甲骨文に見られる文字を継承したもので、「竜」という形は早くとも漢代以降に作られたものだが、「竜」が「龍」より古くから存在するというトンデモが存在する。 「竜」が「龍」より古いというトンデモには全く根拠がないが、ほとんどの人は漢字の歴史について無知なのと、このトンデモが本当なら意外なので(逆に)、一定数の人が信じているようである。 実際には、「竜」が「龍」より古いなどということは無い。これは「最終的には「龍」も「竜」も同じ甲骨文字に由来するのだからどちらかが古いと言うことはできない」というような表現的問題ではなく(それも一理あるかもしれないが、ここではどちらかが古いという表現を受け入れよう)、「竜」が「龍」より古いというトンデモが描いている歴史が決定的に間違っているという意味である。 この記事で「竜」「龍」の歴史を再確認することで、トンデモの歯止めになれば幸いである

                                              「竜」の字体が「龍」よりも古いというトンデモについて|nkay
                                            • 写研書体だわ マジで写研だ ~愛のあるユニークで豊かなOpenType書体~|祥太

                                              2024年10月15日午前8時頃、モリサワによって写研書体がリリースされ、Morisawa Fontsにて使用可能となりました。 これは歴史の一大転換点であり、個人的にはデザイン・印刷史上、 モリサワがAdobeにPostScriptフォントを提供(1989) MacOSXにヒラギノ書体を標準搭載――“ヒラギノショック”(2001) フォントワークスがフォントの定額サブスク「LETS」を開始(2002) に匹敵、もしくは超えるターニングポイントであると考えています。デザインやフォントに詳しい方でないと、なかなか伝わらないと思いますが。 ちなみに写研というのは元々、こういうものです。まずはご覧ください。 これは現在のデザイン・印刷業界で主流のデジタルなDTPワークフローが登場する前の、手動写植機やフィルムを使用していた時代の雑誌制作風景です。 これがデジタルに移行していく過程で現在主流になっ

                                                写研書体だわ マジで写研だ ~愛のあるユニークで豊かなOpenType書体~|祥太
                                              • 海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される

                                                by Whooym 文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと。そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。 A Field Guide to Japanese Mojibake https://www.dampfkraft.com/mojibake-field-guide.html マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。 ◆UTF-8 UTF-8はインターネット上では最も一般的な文字

                                                  海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
                                                • アドビ、日本語対応フォントをGitHubで無料配布

                                                  日本語を含む3カ国語に対応したオープンソースフォント「Source Han Sans」をアドビがリリースした。Apache 2.0ライセンスで公開されており、Adobe Typekitのほか、GitHub、SourceForgeから無償でダウンロードできる。 Source Han Sansは、日本語/中国語(簡体字、繁体字)/韓国語の3カ国語(CJK)、台湾および香港の文字セットに対応したOpenTypeフォント。6万5535文字を収録し、Adobe-Japan1-6に含まれる異体字もカバーする。ウェイトはそれぞれExtraLightからHeavyまでの7種類。なお、日本語のフォント名では「Source」の日本語をイメージした「源ノゴシック」と表示される。 開発にあたっては、グーグルが資金提供とテスト、アドビが字形デザインとプロジェクト管理を担当。「6万5000以上の文字を1社で作るのは難

                                                    アドビ、日本語対応フォントをGitHubで無料配布
                                                  • asahi.com(朝日新聞社):日本IT界の鬼っ子「外字問題」解消を 経産省が着手 - 社会

                                                    「外字(がいじ)」。コンピューターで使う漢字として日本工業規格(JIS)が定めた約1万字に含まれない、規格外の文字たち。文字化けや正常なデータ通信ができない原因になり、IT業界にとって悩ましい、この「外字問題」を一気に解消しようというプロジェクトが始まった。パソコンで文章を書くときの使い勝手は大きく変わるのか――。  例えば「渡辺」の「辺」。JIS規格には「邊」「邉」をあわせた3文字しか含まれないが、100字近い異体字があるとされる。  約58万人分の戸籍を扱う東京都足立区。区役所のパソコン画面には49もの「辺」の異体字が現れた。戸籍などを管理するコンピューターシステムに区が登録したものだ。名前に未登録の漢字がある住民が転入するたびに増え、今では外字全体で約5千もある。  外字を作るのは区職員。パソコンで、1文字に30分ほどかけて点描する。完成後は庁内や出先機関にある千数百台のパソコンに登

                                                    • 『釣りキチ三平』の矢口高雄先生の高すぎる画力はどこから来たのか「本当に異常に上手い」

                                                      リンク Wikipedia 矢口高雄 矢口 高雄(やぐち たかお、1939年10月28日 - 2020年11月20日)は、日本の漫画家・エッセイスト。株式会社矢口プロダクション代表取締役。本名:高橋 高雄(たかはし たかお 戸籍上は「高」が異体字(はしご髙)で髙橋 髙雄)。血液型A型。 自然の中での生活をテーマにした作品を描き、代表作の『釣りキチ三平』、『幻の怪蛇バチヘビ』で、釣りとツチノコブームを起こした。 秋田県雄勝郡西成瀬村(現:横手市)生まれ。町の中心部から20km離れた山村に生まれ、自然に囲まれて育つ。この子供時代の生活が、後に漫画 3 users 24

                                                        『釣りキチ三平』の矢口高雄先生の高すぎる画力はどこから来たのか「本当に異常に上手い」
                                                      • アメリカ史で注意すべきこと(人名の異綴りについて):東欧人と日本人など、本来ローマ字を使わない移民(例:「ワタナベ」の綴りは少なくとも22種ある) - Comments by Dr Marks

                                                        昨夜は、たまたま入手したハーヴァード大学燕京研究所の出版物の著者の一人である日系人について調べていたが、恐ろしいことにネットだけで遺族の住所や電話番号までわかってしまった。本人は一応ハーヴァードやエールで教育を受けておりワシントンDCの American University の教授ではあったが(1912年生−1978年没)、著書は、その共著であるものと、単著は学位論文しかない。研究者というよりは、単なる大学教授であるから、普通にはヒットしないのだが、アメリカの国勢調査は70年経つと公開されるので誰でもアクセスできたのだ。(そこから情報を繋いだ。) そのとき思い出したことを書く。東欧から来た人たちは、19世紀から第二次世界大戦後も、多くが自分の名前のローマ字表記で悩み、面倒なので、西欧の該当する名前とか、西欧風の名前に変えてしまった者も多い。前者はヴァッセルマンがウォーターマンなどで、後者

                                                          アメリカ史で注意すべきこと(人名の異綴りについて):東欧人と日本人など、本来ローマ字を使わない移民(例:「ワタナベ」の綴りは少なくとも22種ある) - Comments by Dr Marks
                                                        • 口頭で名前を説明されるのが好き

                                                          特に電話口で、自分の名前を漢字でどう書くか説明する場面あるじゃん? 「増えるに田んぼで『ますだ』、利益の益、荒川の荒に男で『ますらお』です」みたいなやつ あれ聞くのが好きなんだよね 当たり前だけどみんな説明する口調が滑らかで、その名前で何十年とやってきた結果、最適化された定型句なんだな~という感があって良い 上の例のように一文字ずつ説明するのも親切だし、「近藤勇の『近藤』です」と有名人を引き合いに出すのも味わい深い 「はしごだか」「土の吉」みたいな異体字もたまらん ワタナベさんのナベの字なんかバリエーション凄いから説明がどんどんこなれていきそう 実務上は直接本人に記入してもらうのが楽なんだけど、たまに聞く機会があるとちょっとうれしい

                                                            口頭で名前を説明されるのが好き
                                                          • Windows と日本語のテキストについて - Windows Blog for Japan

                                                            すべての Microsoft 製品 Global Microsoft 365 Teams Copilot Windows Surface Xbox セール 法人向け サポート ソフトウェア Windows アプリ AI OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox とゲーム PC ゲーム Windows ゲーム 映画とテレビ番組 法人向け Microsoft Cloud Microsoft Security Azure Dynamics 365 一般法人向け Microsoft 365 Microsoft Industry Microsoft Power Platform Windows 365 開発者

                                                              Windows と日本語のテキストについて - Windows Blog for Japan
                                                            • フォントがもっと分かる!欧文フォントの名前に付いているアレの正体とは?

                                                              普段使っているフォントにはフォント名のほかに、MT、Std、OsF、CEなど見慣れない省略文字が付いていることがあります。その正体とは一体何なのでしょうか?個人的に気になったものを中心に詳しく調べてみました。 多くの場合はフォントブランド名や太さ・スタイルを示す 有名・定番フォントはライセンスの関係上、様々なフォントブランドが同じ名前の書体のフォントをリリースしているため、区別するために省略文字が付けられていることがあります。頭についたり後ろについたりします。 割とよく見かけるブランドだと、FF=FontFont、BT=Bitstream、MT=Monotype、ITC=International Typeface Coprporationでしょうか。皆さんのパソコンにインストールされているフォントにも多く見つかるはずです。最近はあまり見かけなくなりましたが、LT=Linotype、A=A

                                                                フォントがもっと分かる!欧文フォントの名前に付いているアレの正体とは?
                                                              • 漢字にも方言のような地域による違いがありますか | ことばの疑問 | ことば研究館

                                                                見付かる地域差 地域性を帯びた文字を方言文字あるいは地域文字、それが漢字であれば方言漢字とも呼びます。中国は国土が広く、方言差も激しいため、古くから各地で方言漢字が作られ、用いられてきました。 日本列島では、北海道から沖縄まで各地に存在しています。奈良時代以前より、金石文、木簡、文書や書籍では使用漢字に地域による変異が現れ、とくに近世以降、文芸や固有名詞の表記などに多数出現します。 近世から言及がなされ始め、近代以降は柳田国男、永野賢、柴田武、見坊豪紀、鏡味明克ほかがそれぞれの立場から概念と実例を提示してきました。 墹之上(ままのうえ) 2018.1.2 静岡県伊豆の国市にて撮影 実例としては 字(字種)としては、東北の「萢」(やち)「轌」(そり)、関東の「圷」(あくつ)、京都の「椥」(なぎ)、中国地方の「嵶」「垰」「乢」(たお、たわ、とう)、九州の「椨」(たぶ 旁が符、鹿、虫などの異体字

                                                                  漢字にも方言のような地域による違いがありますか | ことばの疑問 | ことば研究館
                                                                • VLGOTHIC FONT FAMILY

                                                                  VLGOTHIC FONT FAMILY VLゴシックフォントファミリ TrueType - Modern Gothic - High visibility - Suitable for Coding - Japanese VLゴシックフォントファミリは、M+アウトラインフォントベースのモダンゴシック体の日本語 TrueType フォントで、 次のような特徴を持っています。 M+ FONTS PROJECT による M+1C および M+1Mフォントを英数字、かな、 および一部の漢字(JIS第一水準漢字を含む約4800文字)に使用 JIS2004字形への切り替えを IVS と OpenTypeFeatureTagでサポート(M+から) (参考: jp04切り替えサンプル、 異体字データベース) 不足部分の一部(約2500文字)をProject Vine の 鈴木大輔が M+ の漢字部品等を

                                                                  • 端末の文字幅問題の傾向と対策 | IIJ Engineers Blog

                                                                    電子メール、ネットワーク機器集中管理、異常検知、分散処理、クラウド基盤などのシステム開発に従事。古代Rubyist。 CLI や TUI なアプリケーションを使っていると、端末の画面が崩れてしまうことがよくあります。 たとえば、こんな TUI が、 環境によってはこんな感じで崩れます。 スクロールなどをしながらしばらく使っているとさらにどんどん崩れていきます。 こうなってしまった場合、とりあえず Ctrl-l で画面を再描画することで、大抵はなんとか読める程度にリセットできますので、ことあるごとに Ctrl-l を連打することになります。 ですが、どうしようもないケースもままあります。 例えば、私の場合は以下のようなシチュエーションで困ります。 w3m でテーブルなどを表示するとレンダリングが崩れる less でログの閲覧の際に表示されるべき文字が表示されず見落としが発生する Wander

                                                                      端末の文字幅問題の傾向と対策 | IIJ Engineers Blog
                                                                    • 「とにかく日本の住所のヤバさをもっと知るべきだと思います」に、住所正規化コンバータはどこまで応えられるのか、やってみた - ジャスミンソフト日記

                                                                      note.com を読みました。私自身も日本の住所の扱いを何とかしないと業務アプリケーションの運用に支障が出ると感じ、2003年に「住所正規化コンバータ」というソフトウェアをリリースし、20年が経過しました。現在は国際航業株式会社様に取り扱っていただいています。 www.kkc.co.jp このブログにあるような指摘にどこまで応えられただろうかということで、社内で試してみました。利用したバージョンは最新の R7.2.0 で、住所マスタは2022年秋版と組み合わせました。その結果を公開します。 住居表示 丁目表記と地番表記の混在に対応しています。 浦安市舞浜2-1-1 郵便番号 都道府県 市区町村 町域 小字・丁目 番地・号 マッチレベル 2790031 千葉県 浦安市 舞浜 2 1-1 号レベル 浦安市舞浜2-11 郵便番号 都道府県 市区町村 町域 小字・丁目 番地・号 マッチレベル 2

                                                                        「とにかく日本の住所のヤバさをもっと知るべきだと思います」に、住所正規化コンバータはどこまで応えられるのか、やってみた - ジャスミンソフト日記
                                                                      • 「円」も「丁寧」も実は略字だった。漢字のプロに聞いた略字のあれこれ

                                                                        変わった生き物や珍妙な風習など、気がついたら絶えてなくなってしまっていそうなものたちを愛す。アルコールより糖分が好き。 前の記事:天使が吹いてる長いラッパを吹きたい。できないから代わりにシャボン玉を吹く > 個人サイト 海底クラブ 「傘」という漢字の略字がほぼ絵 私が見つけたおもしろい略字というのがこれだ。 「傘」の略字。ほぼ絵じゃん。 京都市内のとある公共施設でこの「傘」を見つけて衝撃を受けたのである。「こんなんでいいのか!」と感動したのだ。 しかも帰ってから調べてみると、この「傘」は略字としてはそこそこメジャーな存在だというではないか。今まで知らずに生きてきたとは......。 きっと世の中にはまだまだ知らない略字があるにちがいない。そこで、私と編集部石川さんに前述の竹澤さん、さらにDPZで文字に関する企画といえばやはりこの人だろうというライター・西村さん(竹澤さんとつないでくれたのも

                                                                          「円」も「丁寧」も実は略字だった。漢字のプロに聞いた略字のあれこれ
                                                                        • 医薬品検索でMySQLの全文検索機能を使った話 - KAKEHASHI Tech Blog

                                                                          AI在庫管理の開発チームでバックエンドエンジニアをしている沖です。今回は、AI在庫管理の医薬品検索において、MySQLの全文検索機能を使った話を紹介しようと思います。 この記事は秋の技術特集 2024の 8 記事目です。 今までの医薬品検索では満足できないユーザーがいた なぜMySQLの全文検索機能を採用したのか 全文検索機能を導入する 全文検索インデックスを付与したテーブルを作成する パーサー 照合順序と正規化 全文検索インデックスを使用して検索する データを最適な状態に保つために おわりに 今までの医薬品検索では満足できないユーザーがいた AI在庫管理には、医薬品の在庫一覧画面など、医薬品名で絞り込む画面がたくさんあります。この絞り込み機能を実現するために、これまではSQLのLIKE検索を利用していました。 LIKE検索は、使い慣れたSQLを用いて部分一致検索を実現できる便利な方法です

                                                                            医薬品検索でMySQLの全文検索機能を使った話 - KAKEHASHI Tech Blog
                                                                          • 中国からベトナムまで約1800キロを寝台列車を乗り継いで行った話

                                                                            旅情をあじわいたい。濃厚な旅情を、たっぷりあじわいたい。 旅情をあじわうためには、いったいどうすればよいのか? そう、寝台列車に乗って旅をすればよい。なぜなら寝台列車イコール旅情だから。 と、思い立ったので、中国の麗江という町から、ベトナムのダナンという町まで、約1800キロほどを、寝台列車を乗り継いで移動してきた。 日本の寝台列車がなければ外国に行けばいいじゃない 日本の寝台列車は軒並み廃止されつづけ、いまや「サンライズ瀬戸・出雲」ぐらいしか残ってない。 しかし、日本以外に目を向けると、まだまだ寝台列車が現役で走っている国はたくさんある。寝台列車に乗りたければ、いっそのこと、そっちに乗ってしまう……という手もあるのではないか。 そんなことを考え、今回、中国の麗江から昆明を経由し、中越国境の河口北、国境を超え、ベトナムのラオカイという町に入り、ラオカイからハノイ経由でダナンまでを、寝台列車

                                                                              中国からベトナムまで約1800キロを寝台列車を乗り継いで行った話
                                                                            • 筑波大の授業DB代替ツールを作った学生、「未踏」のスーパークリエータに認定 オープンソースの組版処理システム開発で

                                                                              経済産業省は5月28日、2020年度のIT人材育成事業「未踏」で採択したクリエータ31人のうち、21人を「スーパークリエータ」に認定したと発表した。筑波大の授業データベース(DB)代替ツール「KdBもどき」を作成した和田優斗さん(18)も、その1人に選ばれた。 20年度のスーパークリエータでは最年少での選出となった和田さんは、オープンソースの日本語組版処理システム「Twight」を開発した。組版とは、印刷物を制作する際に、文字や図をページ上に配置する工程を指す。Twightでは、XML、CSS、JavaScriptの3言語を用いて、テキストベースで雑誌のようなレイアウトの作品を作成できる。高度なグラフィックス処理を実現しつつ、拡張性に優れ、雑誌だけでなく、ポスターや論文執筆など幅広い分野で応用できる点が特徴だという。 プロジェクトの担当者は「使い物になる、といったレベルではない」と絶賛。「

                                                                                筑波大の授業DB代替ツールを作った学生、「未踏」のスーパークリエータに認定 オープンソースの組版処理システム開発で
                                                                              • 「痴漢」になってしまった性依存症患者たちについて思うことなど徒然

                                                                                https://anond.hatelabo.jp/20220317162935 https://anond.hatelabo.jp/20220318013755 少し前に痴漢被害に遭ったよという話をした増田です。進捗と引き続き思うこと徒然を書きたいと思います。 ・事件後に被害者が辿る流れ(当日~その後) ・過去にあった痴漢加害者たちの様子と性依存症 大体この二点になるかと思う。 私が体験したことを通して知りうる限りの実情、痴漢加害者ってどんな感じなの?というあたりの話。 追記ここから 私感でいろいろ述べるのは危ないと指摘してくださった方、ありがとう。増田だからとつい気を抜きました。 あくまで私の体験とそれにまつわる感想の範囲に過ぎない、専門性は低い私感です。 詳しい見解はブコメ等でも指摘されている本や専門知識のある方に委ねるものとなるます。 ここでは専門家ではない一般人の受けた印象と、並

                                                                                  「痴漢」になってしまった性依存症患者たちについて思うことなど徒然
                                                                                • 最近の『なんかいい感じの邦画』はこういう字体のタイトル表記が多い?→“サブカルのチョロい化”なのでは?→様々な意見が集まる

                                                                                  柴崎祐二 @shibasakiyuji 評論家/音楽ディレクター 単著『ポップミュージックはリバイバルをくりかえす 「再文脈化」の音楽受容史』(イースト・プレス)他、編著『シティポップとは何か』(河出書房新社) 他、連載「未来は懐かしい」(TURN)「その選曲が、映画をつくる」(NiEW)他 shibasaki1011@gmail.com 柴崎祐二 @shibasakiyuji 最近の「なんかいい感じの邦画」、こういう字体のタイトル表記多すぎじゃないですか? ここまで溢れかえっているのをみると、マーケティング対象たる「サブカル層」って、映画業界内でも完全にチョロい存在として考えられているのだろうなー、、、と。 pic.twitter.com/246YQJJ5wJ

                                                                                    最近の『なんかいい感じの邦画』はこういう字体のタイトル表記が多い?→“サブカルのチョロい化”なのでは?→様々な意見が集まる