並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 30 件 / 30件

新着順 人気順

異体字の検索結果1 - 30 件 / 30件

  • 「本醸造の醤油が当たり前になったのはここ20年ぐらい」と言っていいのは今から30年前 - 醤油手帖

    ※現在は修正が入りました! 迅速な対応に感謝します(2020/10/06追記) 醤油が大好きな人としては歴史改ざんなんてされてはたまらないという事例がありました。2020年9月30日に朝日新聞のサイトで公開されたこちらの記事です。 www.asahi.com 10月3日にはYahoo!に掲載されて、より多くの人が読むようになりました。そこで「本当なの?」と問い合わせがきてとんでもない記事に気がついた次第です。 news.yahoo.co.jp 一体何が問題なのか。 それは最初の章の以下の部分です。 戦時中に大豆の供給が逼迫(ひっぱく)して、その代替品としてカイコのさなぎ、しかも油を採取したあとの搾り粕(かす)から醬油(しょうゆ)が作られたことを知ったときは衝撃でした。さらにその後、アミノ酸液に味つけしただけの化学的な『アミノ酸醬油』が出回るようになり、醬油が本来の味を取り戻すには長い時間が

      「本醸造の醤油が当たり前になったのはここ20年ぐらい」と言っていいのは今から30年前 - 醤油手帖
    • 文字コード | 衆議院議員 河野太郎公式サイト

      2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日本語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。 ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55,270文字もあります。 全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を2011年に策定し、それにあわせたフォントを作成し、無償で提供しています。 この「文字情報基盤」(MJ)には、58,862文字が含まれています。 しかし、このMJを全庁的に採用している自治体は、川口

        文字コード | 衆議院議員 河野太郎公式サイト
      • 化学を「ばけがく」と読むみたいな言葉一覧・完全版

        科学と化学が、同じようなシーンで使うのに、どっちも「かがく」という読みであり、伝えにくい……こういうことって、よくありますよね。 でも、大丈夫。化学の方を「ばけがく」とわざと読む読み方があるんです! これは便利! こういう言葉って他にどんなのがあるのか気になったので、調べてみた。 「説明読み」と言われているらしい 化学と科学が紛らわしいので、化学の化をわざと訓読みして、ばけがくと読むみたいな言葉。ウィキペディアを調べると「説明読み」と呼ばれているらしい。(武部良明「二字漢字語の音訓読み分けについて」) 正しい読みかたではないけれど、紛らわしさをさけるため、わざと読みを変える。 すぐ思いつくのは、私立と市立の読み分け。私立を「わたくしりつ」、市立を「いちりつ」と読み替える例だろう。 テレビのニュースなどでは、なんの説明もなく「わたくしりつの学校で〜」というふうに普通に読み上げるので、もはやこ

          化学を「ばけがく」と読むみたいな言葉一覧・完全版
        • 絵文字を支える技術について|nona

          はじめにこちらはmhidakaが建立したAdvent Calendar Day.3となります。 こんにちは、はじめまして、のなと申します。mhidakaさんのTweetを見つけて、初めてAdvent Calendarなるものを書いています。なにかお作法間違っていたら大目に見てください、よろしくお願いします。 軽く自己紹介をさせていただくと、普段はGoogleでAndroidのTextまわりの開発を行っており、DroidKaigiやShibuya APKで発表させていただいたりしています。最近はほぼ絵文字の話しかしてないので、絵文字おじさんと思われてそうですが、普段の仕事は絵文字に限らず、Androidの文字表示の部分は大抵面倒をみています。 今回この機会をいただいたので、どんな内容を書こうか迷ったのですが、やはり皆が読んで面白い内容というと、絵文字になるのかなぁ、ということで性懲りもなく絵

            絵文字を支える技術について|nona
          • 基本4情報での名寄せは難しい|MORIDaisuke

            先日は住所の件でお楽しみでしたね。 私も楽しくなってしょうもないツイートをしたところ、@masanorkさんから有用な情報をいただいてしまいました。 異体字に加えて外字も根深いですし、日付型に収まらない住基の生年月日とか、屋号を含んだ個人事業主の口座名義とか、外国人氏名における住民登録のアルファベットと口座名義のカタカナとの解離とか、旧姓併記の例外処理とか、文字列型に刻まれたバッドノウハウの塊ですね https://t.co/GOaytijfst — Masanori Kusunoki / 楠 正憲 (@masanork) June 6, 2023 このとき、私はごく簡単な「名寄せの難しさ」の社内研修資料を作っている最中だったのですが、この情報が大変参考になりました。 一方、私だけが得をしているのがなんとなくムズムズしてきたので、ここにアウトプットしてスッキリしようと思います。 なお、住所

              基本4情報での名寄せは難しい|MORIDaisuke
            • 日本における「名寄せ」と「照合」の黒歴史

              健康保険証、銀行口座、年金記録――個人のマイナンバーに別人の情報がひも付けられるトラブルが後を絶たない。多くの事案に共通するのは、自治体や関係機関の職員が氏名や生年月日などを基にマイナンバーや住民データを照会した際に、誤って同姓同名の人の情報を引き出してひも付けてしまうというケースだ。 こうした情報のひも付けをする際、職員が住民データの照合や突合、本人確認に使うのが「氏名」「生年月日」「性別」「住所」、いわゆる基本4情報といわれるものだ。 だがこの4情報は、コンピューターによる自動処理とは絶望的に相性が悪い。例えば氏名は「邊」「邉」など旧字・異体字の揺らぎや外字の処理が煩雑なうえ、婚姻による改名もある。よくある氏名の場合、氏名も生年月日も同一というケースが頻発する。住所は時期によって変わるうえ、人によって書き方が「一丁目四番」から「1―4」まで一意ではない。 こうした曖昧な識別符号を代替す

                日本における「名寄せ」と「照合」の黒歴史
              • IPAが無償で提供している文字の検索システムがなかなかイケていると話題に/関連する文字をグラフで表示。異体字の一覧も可能【やじうまの杜】

                  IPAが無償で提供している文字の検索システムがなかなかイケていると話題に/関連する文字をグラフで表示。異体字の一覧も可能【やじうまの杜】
                • 『戸籍統一文字』の見たことない漢字はいったいなに?

                  法務省が、戸籍で取り扱う文字を整理した「戸籍統一文字」を検索できるウェブサイト「戸籍統一文字情報」で、漢字を検索すると、みたことのない漢字がゾロゾロでてきて、たいへんおもしろい。 当サイトでは、昨年動画で取り上げたうえに、記事化までしていじり倒してきた。 この、みたことのない漢字をいじっておもしろがるのは、それはそれでいいけれど、やはり「なんでこんな漢字があるのか」という、素朴な疑問も当然わく。 そこで、漢字に詳しいひとと一緒に、戸籍統一文字にある不思議な文字を一緒にみてもらうことにした。 「戸籍統一文字」とは? 日本語を話す日本人が普段使うとされている漢字は、常用漢字としてまとめられており、その数は現在2136文字ある。 そのほか、めったに見かけないけれど、読んだり書いたりできる漢字。読み方もわからないけれど、どこかで使われている漢字をあわせて、かなり多めに見積もっても、おそらく3000

                    『戸籍統一文字』の見たことない漢字はいったいなに?
                  • 海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される

                    by Whooym 文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと。そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。 A Field Guide to Japanese Mojibake https://www.dampfkraft.com/mojibake-field-guide.html マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。 ◆UTF-8 UTF-8はインターネット上では最も一般的な文字

                      海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
                    • 『釣りキチ三平』の矢口高雄先生の高すぎる画力はどこから来たのか「本当に異常に上手い」

                      リンク Wikipedia 矢口高雄 矢口 高雄(やぐち たかお、1939年10月28日 - 2020年11月20日)は、日本の漫画家・エッセイスト。株式会社矢口プロダクション代表取締役。本名:高橋 高雄(たかはし たかお 戸籍上は「高」が異体字(はしご髙)で髙橋 髙雄)。血液型A型。 自然の中での生活をテーマにした作品を描き、代表作の『釣りキチ三平』、『幻の怪蛇バチヘビ』で、釣りとツチノコブームを起こした。 秋田県雄勝郡西成瀬村(現:横手市)生まれ。町の中心部から20km離れた山村に生まれ、自然に囲まれて育つ。この子供時代の生活が、後に漫画 3 users 24

                        『釣りキチ三平』の矢口高雄先生の高すぎる画力はどこから来たのか「本当に異常に上手い」
                      • 口頭で名前を説明されるのが好き

                        特に電話口で、自分の名前を漢字でどう書くか説明する場面あるじゃん? 「増えるに田んぼで『ますだ』、利益の益、荒川の荒に男で『ますらお』です」みたいなやつ あれ聞くのが好きなんだよね 当たり前だけどみんな説明する口調が滑らかで、その名前で何十年とやってきた結果、最適化された定型句なんだな~という感があって良い 上の例のように一文字ずつ説明するのも親切だし、「近藤勇の『近藤』です」と有名人を引き合いに出すのも味わい深い 「はしごだか」「土の吉」みたいな異体字もたまらん ワタナベさんのナベの字なんかバリエーション凄いから説明がどんどんこなれていきそう 実務上は直接本人に記入してもらうのが楽なんだけど、たまに聞く機会があるとちょっとうれしい

                          口頭で名前を説明されるのが好き
                        • Windows と日本語のテキストについて - Windows Blog for Japan

                          すべての Microsoft 製品 Global Microsoft 365 Teams Copilot Windows Surface Xbox セール 法人向け サポート ソフトウェア Windows アプリ AI OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム 映画とテレビ番組 法人向け Microsoft Cloud Microsoft Security Azure Dynamics 365 一般法人向け Microsoft 365 Microsoft Industry Microsoft Power Platform W

                            Windows と日本語のテキストについて - Windows Blog for Japan
                          • 端末の文字幅問題の傾向と対策 | IIJ Engineers Blog

                            電子メール、ネットワーク機器集中管理、異常検知、分散処理、クラウド基盤などのシステム開発に従事。古代Rubyist。 CLI や TUI なアプリケーションを使っていると、端末の画面が崩れてしまうことがよくあります。 たとえば、こんな TUI が、 環境によってはこんな感じで崩れます。 スクロールなどをしながらしばらく使っているとさらにどんどん崩れていきます。 こうなってしまった場合、とりあえず Ctrl-l で画面を再描画することで、大抵はなんとか読める程度にリセットできますので、ことあるごとに Ctrl-l を連打することになります。 ですが、どうしようもないケースもままあります。 例えば、私の場合は以下のようなシチュエーションで困ります。 w3m でテーブルなどを表示するとレンダリングが崩れる less でログの閲覧の際に表示されるべき文字が表示されず見落としが発生する Wander

                              端末の文字幅問題の傾向と対策 | IIJ Engineers Blog
                            • 「とにかく日本の住所のヤバさをもっと知るべきだと思います」に、住所正規化コンバータはどこまで応えられるのか、やってみた - ジャスミンソフト日記

                              note.com を読みました。私自身も日本の住所の扱いを何とかしないと業務アプリケーションの運用に支障が出ると感じ、2003年に「住所正規化コンバータ」というソフトウェアをリリースし、20年が経過しました。現在は国際航業株式会社様に取り扱っていただいています。 www.kkc.co.jp このブログにあるような指摘にどこまで応えられただろうかということで、社内で試してみました。利用したバージョンは最新の R7.2.0 で、住所マスタは2022年秋版と組み合わせました。その結果を公開します。 住居表示 丁目表記と地番表記の混在に対応しています。 浦安市舞浜2-1-1 郵便番号 都道府県 市区町村 町域 小字・丁目 番地・号 マッチレベル 2790031 千葉県 浦安市 舞浜 2 1-1 号レベル 浦安市舞浜2-11 郵便番号 都道府県 市区町村 町域 小字・丁目 番地・号 マッチレベル 2

                                「とにかく日本の住所のヤバさをもっと知るべきだと思います」に、住所正規化コンバータはどこまで応えられるのか、やってみた - ジャスミンソフト日記
                              • 「円」も「丁寧」も実は略字だった。漢字のプロに聞いた略字のあれこれ

                                変わった生き物や珍妙な風習など、気がついたら絶えてなくなってしまっていそうなものたちを愛す。アルコールより糖分が好き。 前の記事:天使が吹いてる長いラッパを吹きたい。できないから代わりにシャボン玉を吹く > 個人サイト 海底クラブ 「傘」という漢字の略字がほぼ絵 私が見つけたおもしろい略字というのがこれだ。 「傘」の略字。ほぼ絵じゃん。 京都市内のとある公共施設でこの「傘」を見つけて衝撃を受けたのである。「こんなんでいいのか!」と感動したのだ。 しかも帰ってから調べてみると、この「傘」は略字としてはそこそこメジャーな存在だというではないか。今まで知らずに生きてきたとは......。 きっと世の中にはまだまだ知らない略字があるにちがいない。そこで、私と編集部石川さんに前述の竹澤さん、さらにDPZで文字に関する企画といえばやはりこの人だろうというライター・西村さん(竹澤さんとつないでくれたのも

                                  「円」も「丁寧」も実は略字だった。漢字のプロに聞いた略字のあれこれ
                                • 中国からベトナムまで約1800キロを寝台列車を乗り継いで行った話

                                  旅情をあじわいたい。濃厚な旅情を、たっぷりあじわいたい。 旅情をあじわうためには、いったいどうすればよいのか? そう、寝台列車に乗って旅をすればよい。なぜなら寝台列車イコール旅情だから。 と、思い立ったので、中国の麗江という町から、ベトナムのダナンという町まで、約1800キロほどを、寝台列車を乗り継いで移動してきた。 日本の寝台列車がなければ外国に行けばいいじゃない 日本の寝台列車は軒並み廃止されつづけ、いまや「サンライズ瀬戸・出雲」ぐらいしか残ってない。 しかし、日本以外に目を向けると、まだまだ寝台列車が現役で走っている国はたくさんある。寝台列車に乗りたければ、いっそのこと、そっちに乗ってしまう……という手もあるのではないか。 そんなことを考え、今回、中国の麗江から昆明を経由し、中越国境の河口北、国境を超え、ベトナムのラオカイという町に入り、ラオカイからハノイ経由でダナンまでを、寝台列車

                                    中国からベトナムまで約1800キロを寝台列車を乗り継いで行った話
                                  • 「痴漢」になってしまった性依存症患者たちについて思うことなど徒然

                                    https://anond.hatelabo.jp/20220317162935 https://anond.hatelabo.jp/20220318013755 少し前に痴漢被害に遭ったよという話をした増田です。進捗と引き続き思うこと徒然を書きたいと思います。 ・事件後に被害者が辿る流れ(当日~その後) ・過去にあった痴漢加害者たちの様子と性依存症 大体この二点になるかと思う。 私が体験したことを通して知りうる限りの実情、痴漢加害者ってどんな感じなの?というあたりの話。 追記ここから 私感でいろいろ述べるのは危ないと指摘してくださった方、ありがとう。増田だからとつい気を抜きました。 あくまで私の体験とそれにまつわる感想の範囲に過ぎない、専門性は低い私感です。 詳しい見解はブコメ等でも指摘されている本や専門知識のある方に委ねるものとなるます。 ここでは専門家ではない一般人の受けた印象と、並

                                      「痴漢」になってしまった性依存症患者たちについて思うことなど徒然
                                    • 筑波大の授業DB代替ツールを作った学生、「未踏」のスーパークリエータに認定 オープンソースの組版処理システム開発で

                                      経済産業省は5月28日、2020年度のIT人材育成事業「未踏」で採択したクリエータ31人のうち、21人を「スーパークリエータ」に認定したと発表した。筑波大の授業データベース(DB)代替ツール「KdBもどき」を作成した和田優斗さん(18)も、その1人に選ばれた。 20年度のスーパークリエータでは最年少での選出となった和田さんは、オープンソースの日本語組版処理システム「Twight」を開発した。組版とは、印刷物を制作する際に、文字や図をページ上に配置する工程を指す。Twightでは、XML、CSS、JavaScriptの3言語を用いて、テキストベースで雑誌のようなレイアウトの作品を作成できる。高度なグラフィックス処理を実現しつつ、拡張性に優れ、雑誌だけでなく、ポスターや論文執筆など幅広い分野で応用できる点が特徴だという。 プロジェクトの担当者は「使い物になる、といったレベルではない」と絶賛。「

                                        筑波大の授業DB代替ツールを作った学生、「未踏」のスーパークリエータに認定 オープンソースの組版処理システム開発で
                                      • 最近の『なんかいい感じの邦画』はこういう字体のタイトル表記が多い?→“サブカルのチョロい化”なのでは?→様々な意見が集まる

                                        柴崎祐二 @shibasakiyuji 評論家/音楽ディレクター 単著『ポップミュージックはリバイバルをくりかえす 「再文脈化」の音楽受容史』(イースト・プレス)他、編著『シティポップとは何か』(河出書房新社) 他、連載「未来は懐かしい」(TURN)「その選曲が、映画をつくる」(NiEW)他 shibasaki1011@gmail.com 柴崎祐二 @shibasakiyuji 最近の「なんかいい感じの邦画」、こういう字体のタイトル表記多すぎじゃないですか? ここまで溢れかえっているのをみると、マーケティング対象たる「サブカル層」って、映画業界内でも完全にチョロい存在として考えられているのだろうなー、、、と。 pic.twitter.com/246YQJJ5wJ 2022-01-19 21:11:50

                                          最近の『なんかいい感じの邦画』はこういう字体のタイトル表記が多い?→“サブカルのチョロい化”なのでは?→様々な意見が集まる
                                        • IPAフォントライセンスを巡って | 一般社団法人 文字情報技術促進協議会

                                          先般、当協議会所属のフォント技術のエキスパートから、MJ明朝体フォントをWOFF化するサービスを提供しているサイトがある、MJ明朝体フォントの使用許諾契約に違反しているのではないか、との指摘があった。事務局長や対外窓口をお願いしている理事の方とも相談して、このサイトのオーナーに連絡を取り、MJ明朝体決め打ちのサービスについては、公開を差し控えていただいた。 ぼく的には、フォントをWOFF化するサービスの必要性もよく分かるし、協議会としても、WOFF化やサブセットフォントの提供など、協議会として直接行うか、協議会メンバーのフォントベンダー各社にビジネスとしてやっていただくかも含めて、具体的な方策を検討しているところだ。 ちょうどいい機会なので、MJ明朝体フォントの使用許諾契約書の成立の経緯と、ついでに、フォントの知的所有権を巡るず〜っと以前のぼくの経験を書き記しておきたい。 そう考えて、経緯

                                          • 仕事早っ!! オープンソースになったMORISAWA BIZ UDゴシックのプログラミング用合成フォント「UDEV Gothic」がリリース

                                            昨日当ブログで紹介した「MORISAWA BIZ UDゴシックとUD明朝がオープンソースになったぞ!!」のMORISAWA BIZ UDゴシックを使用したプログラミング用合成フォントが早くもリリースされたので、紹介します。 UDEV Gothic -GitHub 作者の方によると、昨日から衝動的に作成しはじめ、本日v0.0.2がリリースしたとのことです。v0.0.2では全角スペース可視化、異体字シーケンスに対応しており、今後は半角ゼロをスラッシュ付きにするなどが予定されています。 【追記: 2022/3/24】 リガチャに対応したv0.0.3がリリースされました。 ユニバーサルデザインなBIZ UDゴシックと、開発者向けフォント JetBrains Mono を合成したフォント『UDEV Gothic』 全角スペース可視化、異体字シーケンスに対応した v0.0.2 をリリースしました🎉h

                                              仕事早っ!! オープンソースになったMORISAWA BIZ UDゴシックのプログラミング用合成フォント「UDEV Gothic」がリリース
                                            • 最近「様」を「樣」の略字で書く子供がいるが、学校授業でどう採点すべき?→画数の違う旧字体にまつわる現代国語の悩み「どちらも正解」「教育的に不正解」

                                              矢野耕平 @campus_yano 昨晩、某校の国語科の先生よりメール相談。「様」を①でなく②で書く子どもたちが最近いるのだが、この採点の扱いをどうすべきと思うか? とのこと。聞けば、②で指導する小学校教員、塾講師もいるとか。わたしは○か×なら後者にしますが、皆様はどう思われますか? pic.twitter.com/0UXIBqmKBD 2023-12-08 14:14:39

                                                最近「様」を「樣」の略字で書く子供がいるが、学校授業でどう採点すべき?→画数の違う旧字体にまつわる現代国語の悩み「どちらも正解」「教育的に不正解」
                                              • ゼロから始める異体字の世界【レトロデザインのための近代日本語講座〈2〉】 - マチポンブログ

                                                今回は「異体字」についてお話しします。すこし専門的な部分もあるので、適宜不要な部分は読み飛ばすことをお勧めします。 こんな問題から始めてみましょう。世田谷区の区章とその説明文は以下のように書かれています。 外輪の円は区内の平和、中心は「世」の文字が三方に広がり、人びとの協力と区の発展を意味しています。(世田谷区の紋章、シンボル | 世田谷区ホームページより) 「中心は『世』の文字」とありますが、そうは見えません。なぜこのような形なのでしょうか。 前回の記事 本記事は連載形式で、前回の補足のような内容になっています。前回の記事もご参照ください。 shokaki.hatenablog.jp クリックで目次の表示/非表示 前回の記事 異体字とは 異体字の認識 異体字の使われ方 どこまでが同じ漢字か 誤字か異体字か 異体字はどうできるのか よく使う字は略字化する 画数の多い字は正確でなくても読める

                                                  ゼロから始める異体字の世界【レトロデザインのための近代日本語講座〈2〉】 - マチポンブログ
                                                • 『三体』三部作が完結したのでマシーナリーとも子と「三体面白かったよね会」をやりました

                                                  ※本記事はアフィリエイトプログラムによる収益を得ています みなさん、話題の超大作中国SF小説『三体』(劉慈欣)って読みました? 先日三部作の完結編である『三体III 死神永生』の日本語版が刊行されたんで、もう全部読んだ人や、タイトルくらいは知ってるって人もいるんじゃないでしょうか。いや~これがぶったまげた内容で、まさかあんなところから始まってこんなところにたどり着くとは……と驚嘆した次第。すごい話すぎて、読み終わった後しばらくボケ~ッとしちゃったもんね、もう。 劉慈欣『三体III 死神永生(上・下)』(Amazon.co.jpより) ということで今回は勝手に邦訳版完結を記念しつつ、同じく『三体』読者である殺人サイボーグVTuberのマシーナリーとも子に「『三体』ってぶっちゃけどうでした?」というのを聞いてみました。『三体』シリーズを読んだ人にはなんでこの人選なのかなんとなく分かると思うんで

                                                    『三体』三部作が完結したのでマシーナリーとも子と「三体面白かったよね会」をやりました
                                                  • 住所正規化のデモ機能を作ったので、日本のヤバい住所を入力してみた

                                                    はじめに 数か月ほど前、住所の正規化が話題になりました。こちらの記事が特に有名ですね。 関連して、こちらの記事も話題になりました。 当時はほかにも色々な人が日本のヤバい住所の例をあげてくれて、とても楽しかったです。 実は弊社でもAddressianという住所正規化サービスを提供しています。初めて目にする変わった住所を見かけたら、とりあえず自社のAPIに投げてみて「おお、正規化できた」「すごい!」などといいながら遊んで働いています。 サービスは無料で利用できますが、今までは利用の手順が面倒でした。 ユーザー登録する APIキーを発行する 住所正規化APIを呼び出すプログラムを用意する(サンプルコードあり) プログラムを実行して住所を正規化する そこで、もっと気軽に住所正規化を試してもらえるように、ユーザー登録しなくても使えるデモ機能を作ってみました。 デモ機能の概要 住所正規化デモ画面 こち

                                                      住所正規化のデモ機能を作ったので、日本のヤバい住所を入力してみた
                                                    • 続『戸籍統一文字』の見たことない漢字、最終章

                                                      法務省のウェブサイト『戸籍統一文字情報』で検索して出てきた見たことのない漢字。これらはいったいなんなのか。 趣味で漢字字典を編纂しているという方に、いろいろと聞いてみた。前回記事「『戸籍統一文字』の見たことない漢字はいったいなに?」の、続きです。 話が長くなってしまったので、続きです 前回、趣味で漢字字典を編纂している竹澤さんに、見たことのない漢字の素性をいろいろと聞いた。 しかし、あまりのボリュームに、いったん区切りとしたが、残りの部分もぜひ読みたいというご意見をいくつか頂いたので、続編を公開することにしたい。 趣味で、漢字字典を製作中という竹澤さん(左上)、筆者・西村(右上)、デイリーポータルZ編集部・古賀さん(左下)、デイリーポータルZ編集部・林さん(右下)以降敬称略 本字、正字、略字、俗字、異体字、常用漢字、人名用漢字……とはいったいなに? 西村:ところで、戸籍統一文字を検索してい

                                                        続『戸籍統一文字』の見たことない漢字、最終章
                                                      • (プログラマのための)いまさら聞けない標準規格の話 第2回 文字コード実践編 | オブジェクトの広場

                                                        プログラマがシステム開発において共通で必要となる、技術と業務の狭間の共通知識を解説します。連載第2回は文字コードの実践編です。 0. 前回の復習と今回の概要 システム開発で必要となる標準規格の話、前回 は文字コードの概要について説明しました。ざっくりまとめるとこんな内容でした。 「符号化文字集合」で文字集合と符号位置を定義し、「符号化方式」でバイト表現に変換していること。 日本では、しばらく文字集合 JIS X 0208 を、ISO-2022-JP、EUC-JP、Shift_JIS の符号化方式で利用してきたこと。 近年は、世界中の文字が扱える Unicode が主流となっており、UTF-8、UTF-16 などの符号化方式があること。 常用漢字、人名用漢字に限っても、字体を正確に扱おうとすると、JIS X 0208 の範囲では不十分であり、JIS X 0213、Unicode、サロゲートペ

                                                          (プログラマのための)いまさら聞けない標準規格の話 第2回 文字コード実践編 | オブジェクトの広場
                                                        • 文字数のカウントはどれが正解なのか?

                                                          A. ユースケース次第でどう実装すべきかは変わる。Intl.Segmenter が万能というわけでもない。 (クソ最悪な小バズをかましてしまったので、贖罪も兼ねて記事を書きました) 「文字数を数える」のは難しい 「文字数を数える」実装は意外と難しいです。というのも、アルファベットや数字だけなら str.length でも正しく数えられますが、絵文字や異体字などが入った文字列は見た目どおりに数えられません。

                                                            文字数のカウントはどれが正解なのか?
                                                          • 強力なグラフィック機能を備えた組版処理システムTwight|情報処理学会・学会誌「情報処理」

                                                            和田 優斗(わだ ゆうと) 組版とは,書籍やパンフレットなどを作る際,文字や図をページに配置する作業のことである.Microsoft Wordを使って文書を作る作業は組版であるし,研究論文を書く人ならLaTeXを使う人も多いだろう. 組版ソフトウェアには,大きく分けて2種類ある.文書のテキストに指示を埋め込んでいく文字ベースの組版処理システムと,画面上で組版結果を見ながらそれを操作していくWYSIWYGエディタである.前者にはTeXや(未踏OBの諏訪敬之氏の)SATySFiが,後者にはWordやAdobe Illustrator,InDesignがある. どちらにも利点がある.WYSIWYGはとっつきやすいが,文字ベースにも,文書から分けてスタイルを記述するゆえ再利用性が高かったり,文字ゆえ差分の把握やバージョン管理がしやすかったり,マクロ定義による拡張や自動処理が可能になる,といったさま

                                                              強力なグラフィック機能を備えた組版処理システムTwight|情報処理学会・学会誌「情報処理」
                                                            • 番外編|あなたの文字認識を拡張する。ドット世界の彫刻家たちー4社のドット書体を味わう。|造字沼ブックス/文字の本を発掘して読みとく

                                                              当連載では、漢字改良に挑んだひとりの人生をその著書を通じて書いてきたが、今回は文字自体に焦点をあてる。とりあげるのは前回に引き続きビットマップフォントだ。 前回の記事で明らかになったのは、次のような結論だ。 ビットマップフォントは何かを差し引くではなく、線を重ね合わせ、シェアすることでドットに複数の役割をもたせる。極限まで省略されているようで、実は何も省略していない。 世の中に明朝体と呼ばれる書体が複数ある。同じようにビットマップフォントもさまざまな企業からリリースされている。8ドットや9ドットのビットマップはギリギリまで削減されているように見えた。しかし、このギリギリのなかに取りうる選択肢がフォントの数だけ存在するのだろうか?それとも概ね同じ形に収斂されてゆくのだろうか? 収斂されてゆくのであれば、それが(9ドットの)究極の到達点であり興味深い。また大きな違いが生じるのであれば、簡略化の

                                                                番外編|あなたの文字認識を拡張する。ドット世界の彫刻家たちー4社のドット書体を味わう。|造字沼ブックス/文字の本を発掘して読みとく
                                                              1