法務省は、戸籍に使われている文字を全て戸籍統一文字に追加すると同時に、ISO/IEC 10646 (UCS)への追加提案をもおこなうことを決めた。UCSへの追加提案をおこなう漢字は、戸籍統一文字555650・558160・559970や登記統一文字01020750・01048110など。なお、世界最先端IT国家創造宣言において
国立アイヌ民族博物館第3回テーマ展示『ウアイヌコㇿ コタン アカㇻ』を見に来た。最初の挨拶文が非常に印象的だったので、ここに引用しておくことにする。 イランカラㇷ゚テ。 ウアイヌコㇿ コタン オルン シネウパ ウタㇻ、 エチコプンテㇰ ナ。 アヌココㇿ アイヌ イコロマケンル 第3回テーマ展示 『ウアイヌコㇿ コタン アカㇻ ―民族共生象徴空間(ウポポイ)のことばと歴史―』 セコㇿ チレコ ワ オロ タ エチエカノㇰ。 2020パ 7チュㇷ゚ 12ト ワノ アイヌ プリ カンナ アシトゥリレ クニネ ウアイヌコㇿ コタン アン。 タン コタン オルン アイヌ ウタㇻ カ シサㇺ ウタㇻ カ レプンクㇽ ウタㇻ カ シネウパ。 アイヌ プリ エヤイパカㇱヌ。 “ウポポイ” アナㇰネ ウアイヌコㇿ コタン ポンレ ネ。 タン トゥンプ オッタ “ウアイヌコㇿ コタン ヘマンタ クス アカㇻ ル
私(安岡孝一)の一昨日の日記の読者から、戸籍統一文字046350はUnicode 10.0に収録されたのか、という趣旨の御質問をいただいた。収録されたのはされたのだが、ちょっとヤヤコシイことになっている。JTC1/SC2/WG2/IRGの原案では、戸籍統一文字046350をU+865F「號」に統合しようとしていたのだが、日本の抵抗にあって、結局、戸籍統一文字046110と統合した上で、U+2D239に収録することになった(cf. JTC1/SC2/WG2/IRG N2088)。ところが、Unicode 10.0(ドラフト)のCJK Extension Fでは、U+2D239にJMJ-057174だけが示されていて、JMJ-057183は示されていない。この結果、戸籍統一文字046110がU+2D239に収録されているのは確かだが、戸籍統一文字046350がどこに行ったのかは、一般の人たちに
知識plusにも書いたのだけど、QWERTY配列に対する誤解は、あまりに多い。とりあえず、橋本毅彦の『〈標準〉の哲学』(講談社, 2002年3月)から、以下の部分を取り上げてみることにする。 ショールズは、自分の作りたてのタイプライターでは、キーを素早く叩くと、キーの動きを印字に伝える金属棒(タイプバー)がからまってしまうことに気づいた。何とかタイプバーがからまないような工夫はないものか? そこでショールズは、キーの配列を変え、続けて打たれるようなキーがキーボード上に離れてあるよう配列し直した。その結果、キーを叩くスピードは遅くなったが、タイプバーはからまないようになった。その配列こそが、現在の標準配列として生き残ることになったQWERTYの配列だったのである。 アルファベット2文字の組み合わせのうち、英語では「th」を続けて打つことが最も多いのだが、この2字はQWERTY配列では非常に近
gojiteji/byt5-small-ain-jpn-mtという言語モデルがリリースされているのを見つけた。名前からすると、ByT5によるアイヌ語→日本語自動翻訳モデルのようだ。試しに使ってみよう。 $ pip3 install -U transformers --user $ python3 >>> from transformers import AutoTokenizer,AutoModelForSeq2SeqLM,TranslationPipeline >>> tkz=AutoTokenizer.from_pretrained("gojiteji/byt5-small-ain-jpn-mt") >>> mdl=AutoModelForSeq2SeqLM.from_pretrained("gojiteji/byt5-small-ain-jpn-mt") >>> pipeline=T
漢字が変更された理由について、JIS規格の改訂作業にかかわった京都大学漢字情報研究センターの安岡孝一・助教授は「漢字の古来の形を重視した国語審議会の答申を新しい規格に反映させたため」と話しています。 「漢字の古来の形」なんて、私、話してないぞ。ちゃんと「旧字体」とか「康煕字典体」って言ったはずだが。そもそも「古来の形」だったら、やっぱり「甲骨文」とかでなきゃダメじゃん。しかも、私のこのインタビュー、「人名用漢字」が2004年に改正されたときに、「2点しんにょうの辻」が「人名用漢字」に追加されたんだけど、「2点しんにょう」で本当によかったのか、っていう話だったはずだ。ところが、このニュース画像では「人名用漢字」のところが完全に削除されてしまって、「JIS X 0213」改正の話であるかのようにスリカエられてるし。いったい、どういうつもりなんだろう…。
『キーボード配列QWERTYの謎』の読者から、松尾公也の『HHKBのControlキーはなぜAの左なんだぜ』(ITmedia NEWS、2019年12月10日)という記事を読んでみてほしい、との連絡をいただいた。 この頃使われていたSun type3キーボードの配列を参考に、HHKBは作られた。だからControlキーがAの横にある。だが、それによってどんなメリットがあるのかという疑問が残る。それは「UNIXハッカーのため、プログラマーのため」だ。 プログラマーはUNIXのコマンドラインインタフェースを多用する。vi、Emacs、シェル。いずれもControlキーが多用される。それは、これらが開発された頃にはControlキーがアクセスしやすい位置にあったからだというのだ。確かに、現在のようにControlキーがはるか左下の遠い位置にあったら頻繁に使うキーコンビネーションは考えにくかったろ
一昨日の日記で書いた「Z80で、Bレジスタに0~99の整数が入っている時に、10で除算した商をHレジスタに、余りをAレジスタに返す」という問題だが、余りをDAAで先に求めて、その後に商を求める方法を、改良できてしまった。 78 LD A,B 0F RRCA 0F RRCA 0F RRCA 27 DAA 87 ADD A 27 DAA 4F LD C,A 78 LD A,B E6 07 AND 07H 91 SUB C 27 DAA E6 0F AND 0FH 4F LD C,A 90 SUB B 67 LD H,A 0F RRCA 84 ADD H E6 0F AND 0FH 67 LD H,A 79 LD A,C 商を求める部分の演算
昨日の『読売新聞』夕刊(東京版、第51222号)のトップに「電子行政 名前の漢字集約」という記事を見つけた。 政府は、行政の電子手続きに使う氏名の漢字を現行の約6万文字から、約1万文字に絞り込む方針を固めた。オンライン化を加速するためだ。たとえば、インターネットを使った納税などで氏名を記載する場合、渡边の「边」は「辺」と表記することにする。全国の自治体も足並みをそろえる必要があり、近く指針を公表する。
私(安岡孝一)の8月8日の日記に関連して、『民事月報』のバックナンバーをあさっていたところ、第5巻第10号(昭和25年10月)p.56に「戸籍の届出及び記載に関する夏時刻の表示方について」(昭和25年9月7日民事甲第2384号民事局長通達)を見つけた。 夏時刻法(昭和二十三年法律第二十九号)第二條第二項の規定によつて、九月の第二土曜日は二十五時間をもつて一日とされているところ、同日の第二十五時間目中に発生した事件について戸籍の届出及び戸籍の記載に関する時刻の表示方につき疑義を生じている向があるようであるが、この表示は「午後十一時何分(夏時刻)」の振合によることに一定した(なお同日の第二十四時間目までの時刻の表示及び同日の第二十五時間目を終つたとき翌日の午前零時と表示することについては、他の日におけると同じである)。從つて、今後は出生及び死亡の各届出書に記載する事件の発生時分並びに死亡に関す
私(安岡孝一)の2017年12月21日と2018年3月2日の日記の読者から、シャルコ・アンナの『外国人が目を丸くした日本の「絵文字」の豊かさ』(BEST T!MES、2018年6月6日)を読んでみてほしい、との御連絡をいただいた。読んでみたのだが、絵文字の歴史に関して書かれた以下の部分が、どうも気になった。 1993年に図2のスマイリーフェイスを含めて、100個以上の絵文字がUnicode1.1の「その他の記号」というブロックに登録されると、ワードの「記号と特殊文字」から選んで打てるようになりました。 Unicodeの「Miscellaneous Dingbats」に、☺☻☹を含む106字が収録されたのは、1991年10月のUnicode 1.0だったりする。でも、この「ワード」って、何のことだろう? この時点でのMS-Wordは、まだUnicode対応しきれてなかったはずだけど?
昨日の日記の読者から、厚生労働省社会・援護局保護課長の「生活保護行政を適正に運営するための手引について」(平成18年3月30日社援保発第0330001号、平成26年4月25日社援保発0425第3号で改正)において、本人同意を取得するよう「手引」されている、という趣旨の御指摘をいただいた。当該通知の「まとめ」を見てみよう。 ア 生活保護の適用や被保護者の支援に当たって、必要な被保護者の病状を把握するための被保護者の病状調査について、法第50条第1項及び指定医療機関医療担当規程第7条に基づく調査を行い、または、法第50条第2項に基づく指導を行った場合には、本人の同意なしに回答(個人情報の提供)を得ることが可能である。 イ 資産や収入の状況等(例:預貯金、生命保険、年金、労災保険等)については、法第29条に基づく関係先調査を行い、これを根拠として回答(個人情報の提供)を得ることが可能である。なお
『ISO 3602をヘボン式に改正要求』の読者から、伊澤拓也の『「ti」「chi」どっち? ローマ字、児童混乱 教員ら「一本化を」』(毎日新聞[東京], 2017年3月21日, 夕刊p.9)という記事を読んでほしい、との御連絡をいただいた。 さまざまな形式が混在したローマ字を統一するため、昭和初期に文部省(当時)がほぼ母音と子音の2文字で構成する訓令式をまとめた。1954(昭和29)年の内閣告示で現在の訓令式のつづりを正しいローマ字として定める一方、ヘボン式の使用も認めた。 『NかMか』にも書いたが、臨時ローマ字調査会(1930年12月15日~1936年6月26日)において、5年半もの激論の末に「訓令式ローマ字」を決めたのだから、文部科学省としては今更その議論を蒸し返したくないだろう。しかしながら、GHQが出したSCAPIN-2(1945年9月3日)以降、「ヘボン式ローマ字」が日本中に広ま
『「ECONOトリビア」QWERTY記事顚末記』の読者から、山田祥平の『スペースインベーダー襲来』(PC Watch、2016年12月16日)という記事を読んでみてほしい、との御連絡をいただいた。読んでみたのだが、TAITOのスペースインベーダーとは何の関係もなく、QWERTY配列に関するガセネタが無造作に書かれていた。 そもそもキーボードはタイプライターの時代からアームが絡まないようにということでQWERTY配列が決まったわけで、その不自然な配列に人間は自分で慣れるしかなかった過去がある。 『キーボード配列 QWERTYの謎』(NTT出版、2008年3月)にも書いたが、現在のQWERTY配列が現れた1882年時点でのタイプライターは、いわゆるアップストライク式であり、「アーム」などという機構を有しない。「アーム」を有するフロントストライク式タイプライターは、「Daugherty Visi
MZ-80Kのチコソシイハキクニマに関して、本日発売の『週刊アスキー』(No.1059)に、「MZ-80Kの文字コードはなぜ変態的だったのか」という記事を特別寄稿した(pp.30-31)。この記事を書くにあたって、プログラムをいくつか準備したのだが、以下に示すプログラムはデカすぎて紙面に組めそうになかったため、涙を飲んでボツにした。 21E1E9 LD HL,E9E1H 22E8D3 LD (D3E8H),HL CDE8D3 CALL D3E8H 181E JR +32 110514150F QETUO 1712190910 WRYIP 0104070A0C ADGJL 1306080B2C SFHK; 1A03020D2E ZCBM. 18160E2F2D XVN,/ 23 INC HL 2
東北大学の外邦図デジタルアーカイブに大正8年測図の与那原1:50000地図があることを御教示いただいた。この地図で見る限り、当時の宜野湾村役場は北緯26度16分5秒東経127度45分25秒附近にあって、現在は普天間基地になっている場所である。ちなみに、現在の宜野湾市役所は北東に3kmほど移っているが、昔も今も市街地の中にあって、田んぼの中というわけではないようだ。 世の中には人文地理学や歴史地理学と呼ばれる研究分野があって、私(安岡孝一)個人もしばしば議論に加えてもらっている。戦前の地図は基本的に軍事機密であることが多く、デジタル化して公開するには、それなりにパワーが必要なのだ(cf.『外邦図研究ニューズレター』No.6)。ただ、この手の研究をちゃんとやっておかないと、軍事機密なのをいいことに、アヤシゲな説を唱えるヤカラが跋扈することになる。人文科学教育の意義ってのは、一つはガセネタを叩き
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く