タグ

安岡孝一氏に関するworks014のブックマーク (287)

  • 人名用漢字と第1・第2水準漢字に対する妄想 | yasuokaの日記 | スラド

    『新しい常用漢字と人名用漢字』の読者から、榎並利博の「電子行政における使用漢字の問題」(情報管理, Vol.57, No.5 (2014年8月), pp.298-306)を読んでほしい、との御連絡をいただいた。正直いって、去年10月の「電子行政における文字コードと外字について」(行政&情報システム, Vol.49, No.5, pp.60-66)から、またさらに病状が悪化していて、もはや手が付けられない。私(安岡孝一)の日記で指摘した点(これとかこれ)が治ってないばかりか、新たな妄想まで湧いている始末だ。特に以下の文章。 JISは経済産業省,住基ネット統一文字は総務省,戸籍統一文字は法務省と縦割りになっており,さらに常用漢字・人名用漢字・表外漢字は文部科学省の管轄である。つまり,国の統一基準がなく,そして今後も統一化される見込みがない。デファクトスタンダードとしてJIS第1水準・第2水準が

  • 文字情報基盤のIVS登録第1弾 | yasuokaの日記 | スラド

    PRI 259の公開レビューが無事はじまった、との連絡をいただいた。Moji_JohoのIVS登録第1弾で、10720字の追加提案であるにもかかわらず、うち9687字のIVSがHanyo-Denshiとかぶっている、という不思議なシロモノだ。 ただ、汎用電子の平成明朝と、文字情報基盤のIPAmj明朝とで、明らかに字形が異なっているにも関わらず、同じIVSを無理矢理シェアしてしまったまま、見切り発車してしまったものがある。ざっと見ただけでも <U+5099 U+E0101> JA4087 MJ006997 6画目の「一」と他画の関係 <U+533B U+E0101> JA1669 MJ007820 「矢」の右下 <U+59FF U+E0103> JA2749 MJ009691 「冫」の下画 <U+5BD9 U+E0102> KS082750 MJ010211 左の「瓜」の右画 <U+6B21

    works014
    works014 2013/12/12
    …「この日記の読者諸氏も、バグを是非どんどん指摘してあげてほしい」…とある…
  • 文字情報一覧表の「入管正字コード」と「入管外字コード」 | yasuokaの日記 | スラド

    文字情報基盤の文字情報一覧表Ver.003.01をざっとチェックしてみたのだが、やはり「入管外字コード」に妙なものが紛れ込んでいる。今回は「入管正字コード」の項目を追加して、「入管外字コード」との分離を図ったはずなのに、どうもそれが徹底されていないようだ。とりあえず、「入管外字コード」で目についたミスを、以下に挙げておくことにする。 MJ011574 6085→F469 MJ012975 654E→EFAC MJ027430 9592→F249 MJ028902 9AD9→F409 ただ、在留カード等に係る漢字氏名の表記等に関する告示(平成23年12月26日法務省告示第582号)の別表第二には、これら以外にも数多くの「入管外字」が収録されているのに、文字情報一覧表Ver.003.01には全く反映されていないようだ。さて、どうしたらいいかな…。

  • 穝、椥辻、薭田野、庾嶺坂 | yasuokaの日記 | スラド

    『行政&情報システム』の今月号(Vol.49, No.5)を読んでいたところ、榎並利博の『電子行政における文字コードと外字について』という記事にぶち当たった(pp.60-66)。今年2月の富士通総研レポートに較べ、さらに病状が悪化しており、もはや、妄想を書きなぐっているとしか思えないシロモノになっている。特に腐っているのが、以下の部分。 我が国における「一般の社会生活において、現代の国語を書き表す場合の漢字使用の目安を示すもの」として、文部科学省文化庁から常用漢字表が公開されている。この字種は2,136字であり、表外漢字字体表を合わせても、せいぜい3,000字である。すなわち、一般の社会生活においては約3,000字があれば十分であるとされている。結論として、現在日語を扱うことができるすべてのコンピュータに搭載されているJIS第1水準とJIS第2水準の範囲内だけで社会的には十分であり、それ

  • 「啯さん」は「嘓さん」なのか「掴さん」なのか | yasuokaの日記 | スラド

    10月23日に共立女子学園で開催される全国連合戸籍住民基台帳事務協議会合同研修会において、以下の2件の要望が、それぞれ長野県と山形県から法務省に提出される予定だ、との御連絡をいただいた。 戸籍事務、及び改正住民基台帳法施行後の中国簡体字等に対応する日の正字による記載の取扱いについて通達等の発出を要望する。 戸籍事務においては、中国簡体字は対応する日の正字で記載することとされているが、改正後の住民基台帳事務の正字への変換とは異なるため、中国人住民について日人配偶者の戸籍に記載された外国人配偶者の氏名と住民票に記載される人氏名で表記が違う事態等が生じている。そのため、同一人の証明として疑義が生じ、戸籍や住民票の信頼を損なうことになりかねない。 このことから、戸籍と住民票の統一取扱いを行えるよう、法務省民事局、法務省入国管理局、総務省自治行政局で調整をいただき、通達等の発出を要望す

  • もじもじカフェ 戸籍と住基とマイナンバーの文字コード - ちくちく日記

    もじもじカフェ第38回「戸籍と住基とマイナンバーの文字コード」に参加してきました。 もじもじカフェは「文字と印刷について市民と専門家・業界人がお茶を飲みながら気楽に話し合う」というイベント。 勉強会とかセミナーとは違って「お茶を飲みながら気楽に」というスタイルなので、会場もこぢんまりした喫茶店のようなところで、講師を中心に皆で大きなテーブルを囲んで話をするスタイル。 今回のテーマは「戸籍と住基とマイナンバーの文字コード」京都大学の安岡孝一氏を講師に現在策定が進められているマイナンバー制度などを文字コードの視点から説明してもらいました。 大変面白かったので、いつものようにレポートを。 このレポートは当日の安岡先生の話を私の手書きメモから書き起こしたものです。 聞き落とした部分もありますし、私が聞き間違えている可能性もあります。 大体こんな話だった程度の物と思ってお読みください。 もし何か間違

    もじもじカフェ 戸籍と住基とマイナンバーの文字コード - ちくちく日記
  • 石井茂吉の「次」と「黑へん」 | yasuokaの日記 | スラド

    先日の『もじもじカフェ』の懇親会で、つい石井茂吉を批判してしまったところ、ぜひ蒸し返してほしい、との御依頼をいただいた。まあ、あまりネタがたくさんあるわけではないのだが、以前『姿と恣と盗』でも発表したとおり、石井明朝体の「次」に関しては正直なところ全く納得がいかない。現代において「姿」と「恣」と「盗」がこんなことになってしまったのは、やはり石井茂吉に責任の一端があると思う。ただ、これは『当用漢字字体表』という不幸な時期に重なっていたこともあって、石井茂吉だけが悪いわけではない。時代の波に翻弄された、とも言えるだろう。 しかし、どう考えても納得がいかないのが「黑へん」だ。昔の日記にも少し書いたが、『大漢和辞典』の48041~48247の「黑へん」のうち、48052・48079・48081・48108・48117のデザインが明らかに違う。こんなの並べてみたら当然、気がついたはずなのに、ほったら

  • マイナンバーとLGWAN都道府県ファイアウォール | yasuokaの日記 | スラド

    私(安岡孝一)が日経ITproに書いた『マイナンバー、その「複雑さ」の真相』第2回『「符号」や「アクセス・トークン方式」は必要か?』に対して、OAuthを知らないのか、という御質問をいただいた。たぶん、知らないと思う。少なくとも私は、LGWAN上でOAuthをセキュアに実装する方法を知らないし、各市区町村の担当者もそうだろう。 もちろん、都道府県ファイアウォールに「穴」を開ければ、あるいはOAuthを実装できてしまうのかもしれないが、その場合に、LGWAN上の他のどの業務にどんなセキュリティ・ホールが開いてしまうのか、私には見当もつかない。OAuthを良く御存じの方は、LGWANに「穴」を開けないような実装を、ブログなり雑誌記事なり論文なりで、ぜひ示してほしいと思う。

  • 第2回 「符号」や「アクセス・トークン方式」は必要か?

    現在、総務省などが検討を進めているマイナンバーのシステムには、様々な問題点が存在する。第2回である今回は、第1回で紹介した「符号」や「アクセス・トークン方式」のような仕組みを使用することの問題点や、マイナンバーのシステムに戸籍電算システムが参加しないことがもたらす問題点を指摘する。 論に移る前に、第1回の内容について補足の説明を行いたい。まず連載で筆者が提示するマイナンバーのシステム構成は、あるITベンダーが市町村の担当者向けに説明を行った「設計案」に基づいている。これは、総務省や市町村の意向を汲んで作られたものではあるが、あくまでもITベンダーによる案であり、今後の検討によって変更される可能性がある。このことをご了承いただきたい。 第1回で筆者は、このITベンダーが作ろうとしているシステムの雰囲気を、できるだけそのままの形でお伝えしようとした。実は、ITベンダーのシステム設計案の中に

    第2回 「符号」や「アクセス・トークン方式」は必要か?
  • もじもじカフェ > 第38回「戸籍と住基とマイナンバーの文字コード」

    内容かつては手書きで行われていた戸籍事務ですが,二十年くらい前から自治体ごとに徐々にコンピュータ化されていきました。そこで問題になったのが,人名・地名の漢字の多さ,とくに異体字の多さです。例えば渡辺の「辺」をとってみても,「邊」「邉」など多数の異体字があります。既存の文字コードでは間に合わないため,自治体ごとに多数の外字を作っていました。しかし,自治体ごとにバラバラではデータ交換に著しい不都合が生じます。法務省は独自の文字コード「戸籍統一文字」を定めました。 一方,住民票のデータベースである住民基台帳では,総務省が住民基台帳ネットワーク統一文字という別の文字コードを定めました。 ここに,先日可決したマイナンバー法に基づくマイナンバーが加わることになります。マイナンバーではユニコードを使う方向で話が進んでいますが,さて一体どうなるのでしょうか。 今回は,文字コード研究家の安岡孝一さん(京

  • 『マイナンバー、その「複雑さ」の真相』第1回の「濵田鷗」 | yasuokaの日記 | スラド

    私(安岡孝一)が日経ITproに書いた『マイナンバー、その「複雑さ」の真相』第1回『「個人番号」では串刺し検索ができない』に対して、高木浩光さんにtwitterで盛大に突っ込まれた。的を射た御指摘なので、すぐにでも答えなきゃいけないのだけど、実はかなりの部分を今後の回でネタにしているので、今は「もうちょっと待ってください、ごめんなさい」にしておきたい。ただ、以下のtweetだけは、私がうまい例を考え付かなかったせいだし、今後の回では出てこない(はずの)ネタなので、今、あやまっておきます。 個人番号の整備完了後は、個人番号で属性情報をやりとりするのだから、氏名の文字が「「濵田鷗」になっていたり、「濵田鴎」になっていたり、「濱田鴎」になっていたり、「浜田鴎」になっていたりする」とか、関係のない話。 確かにおっしゃる通りで、私自身ここは当は「両方のサーバーでデータが変わり得て、実は文字コードの

  • マイナンバー、その「複雑さ」の真相

    マイナンバーに関連するシステム調達は、巨額となる見込み。なぜならマイナンバーはかなり複雑なシステムであり、要求要件が非常に難しいからだ。マイナンバーや文字コードの問題に詳しい京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、マイナンバーのシステムが抱える複雑さや、システムを開発する上での難しさを解説する。

    マイナンバー、その「複雑さ」の真相
    works014
    works014 2013/05/17
    …目次となっているがリンクが繫がっていない…
  • 第1回 「個人番号」では串刺し検索ができない

    マイナンバー法案が、国会で審議中だ。システム調達は巨額で、特需が生じると分析する向きもあるが(関連記事)、システム調達費用が巨額になるのには、それなりに理由がある。マイナンバーはかなり複雑なシステムであり、要求要件が非常に難しいからだ。 連載では、マイナンバーのシステムが抱える複雑さや、システムを開発する上での難しさを解説する。連載第1回である今回は、マイナンバーがどのような設計原理に基づいているのか。以下に示した図を基に、例を挙げて説明しよう。 サーバーをまたいでの串刺し検索が許されていない マイナンバーの特徴は、「個人番号を使ったサーバーをまたいでの串刺し検索が、一切できない」という点にある。例として、「ある人物の年金加入記録を郵送したところ、転居先不明で日年金機構に戻ってきてしまった」という場合を考えてみよう。 マイナンバーを導入すると、日年金機構は以下の手順で、転居先を調べる

    第1回 「個人番号」では串刺し検索ができない
  • 「浚」は常用平易か(第3回) | 人名用漢字の新字旧字(安岡 孝一) | 三省堂 ことばのコラム

    実は、平成16年の人名用漢字部会は、第2水準漢字に対して非常に冷淡でした。一例として、平成16年5月28日の人名用漢字部会議事録から、第2水準漢字(議事録では「2水」と呼んでいます)の「泪」が落とされた瞬間を見てみましょう。 違うのは,「泪」の方,こちらの字をとる必然性があるかなというような気がするのですね。要望数を比べてみても,後の⑱以下のは随分違いますから。というようなことで,この辺になると,もう個別の,2水の方はどうも趣味的なものが多くなってきて,字の形,草かんむりがついているとか,女へんだとか,そういう好ましい字とか読みとかという問題ですから,そういうようなことで言うと,この「泪」という字は,どういう根拠でこれを使うかななんて思うと,ちょっとためらいがあるのですが。 同じ日に、第2水準漢字の「檸檬」が落とされてしまった瞬間も見てみましょう。 これも提案ですけれども,先ほど,3をそれ

    「浚」は常用平易か(第3回) | 人名用漢字の新字旧字(安岡 孝一) | 三省堂 ことばのコラム
  • 「浚」は常用平易か(第2回) | 人名用漢字の新字旧字(安岡 孝一) | 三省堂 ことばのコラム

    実際、人名用漢字部会が公開した578字の追加案(平成16年6月11日)には含まれていなかったのに、その後、法務省が「常用平易」だと認めて、新たに子供の名づけに使えるようになった漢字は、37字もあります。 俠・掬・瘦 (平成16年9月27日) 祷・穹 (平成21年4月30日) 彙・・楷・諧・毀・嗅・惧・憬・錮・傲・恣・摯・羞・箋・踪・緻・嘲・捗・貪・丼・氾・訃・璧・哺・麺・喩・瘍・沃・拉・辣・慄・籠 (平成22年11月30日) 人名用漢字部会だって、万能ではないのです。人がおこなう調査には必ず漏れがありますし、それに加えて「常用平易」という概念そのものが、時代に応じて変化していくものなのです。 平成23年5月10日、さいたま家庭裁判所は、「浚」が戸籍法第50条でいうところの「常用平易」な文字であると判断し、「浚義」ちゃんの出生届を受理するよう、さいたま市南区長に命令する審判を下しました。両

    「浚」は常用平易か(第2回) | 人名用漢字の新字旧字(安岡 孝一) | 三省堂 ことばのコラム
  • 常用漢字は「JEF拡張漢字」ではないのか | yasuokaの日記 | スラド

    常用漢字は「外字」なのかの読者から、常用漢字の「頰」は富士通JEFでは第1水準漢字だ、との御指摘をいただいた。うーむ、確かに、言われてみればそうだ。「頰」だけじゃなく、「剝」も「塡」もJEF第1水準だ。とすると、私(安岡孝一)が書いた はシャレでも何でもなく、JEF第1水準とJEF第2水準で常用漢字はカバーできるので問題ない、と榎並利博は気で考えている可能性があるわけだ。 しかし逆に、常用漢字の「喝」や「褐」はJEF拡張漢字なので、富士通JEFの立場からすると第1水準でも第2水準でもない。同様に、常用漢字の「頻」や「遮」や「塚」や「媛」や「隙」や「拳」や「麺」も、富士通JEFでは拡張漢字だ。つまり、JEF第1水準と第2水準でも、現在の『常用漢字表』2136字はカバーしきれないのだが、さて、榎並利博の考えるJIS第1水準とJIS第2水準っていうのは、どういう字体をしているのだろう?

  • 常用漢字は「外字」なのか | yasuokaの日記 | スラド

    榎並利博の『電子行政における外字問題の解決に向けて』(富士通総研経済研究所研究レポート, No.400, 2013年2月)を読んでほしい、とアチコチから連絡をいただいた。読んでみたのだが、2010年の『常用漢字表』改定にまつわる議論を全くフォローしておらず、そのために、正直かなり頓珍漢な内容となっている。それを端的に示しているのが、【追補2】の以下の文章だろう(p.41)。 時代に即して合理的に物事を考え、外字問題を解決していくのは、来国語審議会の役割ではないだろうか。国語審議会の存在意義が問われていると言っても良いだろう。 存在意義も何も、国語審議会は2000年12月に、『表外漢字字体表』の答申をもって解散した。いまさら存在意義とか言われても、読者は困惑するばかりだろう。こういう調子なので、文化審議会国語分科会が答申した『改定常用漢字表』も全く理解しておらず、その結果、以下のようなわけ

  • 人名用漢字別表から削られた17字 | yasuokaの日記 | スラド

    昨日の私(安岡孝一)の日記の読者から、昭和26年4月4日の国語審議会固有名詞部会で挙げられていた106字のうち、『人名用漢字別表』(昭和26年5月25日内閣告示第1号)から落ちたのは、具体的にどの漢字なのか、という趣旨の御質問をいただいた。まずは、3月27日の部会資料『人名に使われる漢字』93字を見てみよう。 伊胤寅亦艶嘉亥鶴巖毅亀崎磯橘匡欣欽錦駒粂圭桂馨鎌彦虎吾弘亙亨宏浩哉杉之巳只爾禰淳庄丞穣尙昌辰晋甚須瑞靖斉仙惣琢智丑猪暢肇蔦蝶鯛亭悌禎桐藤敦奈楠稔弥輔朋卯睦麿也酉祐佑熊蘭鯉龍亮綾玲呂鹿禄畩 手書きのガリ版刷りのため、たとえば「寅」は一画消えていて「⿳宀由八」みたいに見えるのだが、まあ、この93字が挙がっているようだ。次に、4月4日の部会資料『人名に使われる漢字(補遺)』13字を見てみよう。

  • 国語審議会固有名詞部会における人名用漢字選定 | yasuokaの日記 | スラド

    人名用漢字の「晋」と「麿」の読者から、松坂忠則が書いた『当用漢字の危機』(教育国語, 第39号 (昭和49年12月), pp.2-23)という記事をお教えいただいた。 この戸籍法改正案は、衆議院は通過したが参議院で押さえられて、流れてしまった。しかし、政府は政治的配慮によって、国語審議会に、人名用の漢字を百字ほど補足する案を注文した。それで国語審議会は九十二字を選んで建議し、それが翌二十六年に「人名用漢字別表」として内閣告示になった。「丞、亮、圭、弥」や、十二支の「丑、寅」の類が選ばれている。わたしもその字さがし作業に加わったが、百字近く集めるのに苦労した。わざわざ補足しなければならないと認められる漢字など、ないからである。 まあ、松坂には松坂の立場があるのだろうが、国語審議会固有名詞部会(昭和26年3月13日, 20日, 27日, 4月4日, 11日, 19日, 5月4日, 14日)の議

  • JIS X 0213のカッコ付きUCS | yasuokaの日記 | スラド

    情報管理今月号に採録された拙稿『住民基台帳ネットワーク統一文字とその問題点』の読者から、どうしてJIS X 0213:2000附属書11「3.3 JIS X 0221からの索引」に、カッコ付きUCSを載せてしまったのか、との御𠮟正をいただいた。以前も書いたと思うのだが、当時の私(安岡孝一)は、ISO/IEC 10646がキライだったからだ。現在は好きなのか、と問われれば、もちろん今もキライなのだが。 もちろん、キライだったからと言って、手を抜いたわけじゃない。当時の私としては、JIS X 0213を、Shift_JISの拡張で使う場合も、ISO-2022-JPの拡張で使う場合も、EUC-JPの変形で使う場合も、UCSの部分集合として使う場合も、全て何らかの方法を示しておいたつもりだ。その意味では「FA1F 1-91-26 (﨟)」や「F9D0 1-94-4 (類)」という索引は、少なく