タグ

ブックマーク / srad.jp/~yasuoka (18)

  • 戸籍に使われている文字が全てISO/IEC 10646 (UCS)へ追加 | yasuokaの日記 | スラド

    法務省は、戸籍に使われている文字を全て戸籍統一文字に追加すると同時に、ISO/IEC 10646 (UCS)への追加提案をもおこなうことを決めた。UCSへの追加提案をおこなう漢字は、戸籍統一文字555650・558160・559970や登記統一文字01020750・01048110など。なお、世界最先端IT国家創造宣言において

  • Universal Dependenciesで読む『ウアイヌコㇿ コタン アカㇻ』 | yasuokaの日記 | スラド

    1月26日の日記で引用した『ウアイヌコㇿ コタン アカㇻ』の挨拶文を、esuparの助けを借りつつ、手作業でUniversal Depedencies化してみた。 # text = イランカラㇷ゚テ。 1    イランカラㇷ゚テ    irankarapte    INTJ    間投詞    _    0    root    _    SpaceAfter=No 2    。    .    PUNCT    記号    _    1    punct    _    _ # text = ウアイヌコㇿ コタン オルン シネウパ ウタㇻ、 エチコプンテㇰ ナ。 1    ウアイヌコㇿ    uwaynukor    VERB    他動詞    _    2    amod    _    _ 2    コタン    kotan    NOUN    名詞    _    3    n

  • アイヌ語の数字はどう読むべきか | yasuokaの日記 | スラド

    国立アイヌ民族博物館第3回テーマ展示『ウアイヌコㇿ コタン アカㇻ』を見に来た。最初の挨拶文が非常に印象的だったので、ここに引用しておくことにする。 イランカラㇷ゚テ。 ウアイヌコㇿ コタン オルン シネウパ ウタㇻ、 エチコプンテㇰ ナ。 アヌココㇿ アイヌ イコロマケンル 第3回テーマ展示 『ウアイヌコㇿ コタン アカㇻ ―民族共生象徴空間(ウポポイ)のことばと歴史―』 セコㇿ チレコ ワ オロ タ エチエカノㇰ。 2020パ 7チュㇷ゚ 12ト ワノ アイヌ プリ カンナ アシトゥリレ クニネ ウアイヌコㇿ コタン アン。 タン コタン オルン アイヌ ウタㇻ カ シサㇺ ウタㇻ カ レプンクㇽ ウタㇻ カ シネウパ。 アイヌ プリ エヤイパカㇱヌ。 “ウポポイ” アナㇰネ ウアイヌコㇿ コタン ポンレ ネ。 タン トゥンプ オッタ “ウアイヌコㇿ コタン ヘマンタ クス アカㇻ ル

  • 戸籍統一文字046350はUnicode 10.0のどこに行ったのか | yasuokaの日記 | スラド

    私(安岡孝一)の一昨日の日記の読者から、戸籍統一文字046350はUnicode 10.0に収録されたのか、という趣旨の御質問をいただいた。収録されたのはされたのだが、ちょっとヤヤコシイことになっている。JTC1/SC2/WG2/IRGの原案では、戸籍統一文字046350をU+865F「號」に統合しようとしていたのだが、日の抵抗にあって、結局、戸籍統一文字046110と統合した上で、U+2D239に収録することになった(cf. JTC1/SC2/WG2/IRG N2088)。ところが、Unicode 10.0(ドラフト)のCJK Extension Fでは、U+2D239にJMJ-057174だけが示されていて、JMJ-057183は示されていない。この結果、戸籍統一文字046110がU+2D239に収録されているのは確かだが、戸籍統一文字046350がどこに行ったのかは、一般の人たちに

    戸籍統一文字046350はUnicode 10.0のどこに行ったのか | yasuokaの日記 | スラド
    quick_past
    quick_past 2022/10/12
    “戸籍統一文字046350”https://bit.ly/3CRLHXO
  • 安岡孝一の日記: QWERTY配列に対する誤解

    知識plusにも書いたのだけど、QWERTY配列に対する誤解は、あまりに多い。とりあえず、橋毅彦の『〈標準〉の哲学』(講談社, 2002年3月)から、以下の部分を取り上げてみることにする。 ショールズは、自分の作りたてのタイプライターでは、キーを素早く叩くと、キーの動きを印字に伝える金属棒(タイプバー)がからまってしまうことに気づいた。何とかタイプバーがからまないような工夫はないものか? そこでショールズは、キーの配列を変え、続けて打たれるようなキーがキーボード上に離れてあるよう配列し直した。その結果、キーを叩くスピードは遅くなったが、タイプバーはからまないようになった。その配列こそが、現在の標準配列として生き残ることになったQWERTYの配列だったのである。 アルファベット2文字の組み合わせのうち、英語では「th」を続けて打つことが最も多いのだが、この2字はQWERTY配列では非常に近

    quick_past
    quick_past 2022/07/15
    おいらも昔、QWERYは連続して出てくる字を打ちやすいような配列と、きいていた
  • gojiteji/byt5-small-ain-jpn-mtによるアイヌ語→日本語自動翻訳 | yasuokaの日記 | スラド

    gojiteji/byt5-small-ain-jpn-mtという言語モデルがリリースされているのを見つけた。名前からすると、ByT5によるアイヌ語→日語自動翻訳モデルのようだ。試しに使ってみよう。 $ pip3 install -U transformers --user $ python3 >>> from transformers import AutoTokenizer,AutoModelForSeq2SeqLM,TranslationPipeline >>> tkz=AutoTokenizer.from_pretrained("gojiteji/byt5-small-ain-jpn-mt") >>> mdl=AutoModelForSeq2SeqLM.from_pretrained("gojiteji/byt5-small-ain-jpn-mt") >>> pipeline=T

  • 漢字の古来の形 | yasuokaの日記 | スラド

    漢字が変更された理由について、JIS規格の改訂作業にかかわった京都大学漢字情報研究センターの安岡孝一・助教授は「漢字の古来の形を重視した国語審議会の答申を新しい規格に反映させたため」と話しています。 「漢字の古来の形」なんて、私、話してないぞ。ちゃんと「旧字体」とか「康煕字典体」って言ったはずだが。そもそも「古来の形」だったら、やっぱり「甲骨文」とかでなきゃダメじゃん。しかも、私のこのインタビュー、「人名用漢字」が2004年に改正されたときに、「2点しんにょうの辻」が「人名用漢字」に追加されたんだけど、「2点しんにょう」で当によかったのか、っていう話だったはずだ。ところが、このニュース画像では「人名用漢字」のところが完全に削除されてしまって、「JIS X 0213」改正の話であるかのようにスリカエられてるし。いったい、どういうつもりなんだろう…。

    quick_past
    quick_past 2019/12/13
    子供に難しい概念を説明しようとして、勝手に相手のレベルに合わせた結果めちゃくちゃいい加減な説明になってしまうパターン。>NHK
  • Controlキーは「A」の左横なのか左下なのか | yasuokaの日記 | スラド

    『キーボード配列QWERTYの謎』の読者から、松尾公也の『HHKBのControlキーはなぜAの左なんだぜ』(ITmedia NEWS、2019年12月10日)という記事を読んでみてほしい、との連絡をいただいた。 この頃使われていたSun type3キーボードの配列を参考に、HHKBは作られた。だからControlキーがAの横にある。だが、それによってどんなメリットがあるのかという疑問が残る。それは「UNIXハッカーのため、プログラマーのため」だ。 プログラマーはUNIXのコマンドラインインタフェースを多用する。vi、Emacs、シェル。いずれもControlキーが多用される。それは、これらが開発された頃にはControlキーがアクセスしやすい位置にあったからだというのだ。確かに、現在のようにControlキーがはるか左下の遠い位置にあったら頻繁に使うキーコンビネーションは考えにくかったろ

    quick_past
    quick_past 2019/12/13
    知人が今まで触ってきた中で一番使いやすかったキーボードは、Intel MDSのものだって言ってたんだけど、コントロールキーはAの左横になってる。https://is.gd/AjDBtZ
  • Re:Z80における定数10の除算は、商と余りのどちらを先に求めるべきか | yasuokaの日記 | スラド

    一昨日の日記で書いた「Z80で、Bレジスタに0~99の整数が入っている時に、10で除算した商をHレジスタに、余りをAレジスタに返す」という問題だが、余りをDAAで先に求めて、その後に商を求める方法を、改良できてしまった。 78      LD A,B 0F    RRCA 0F    RRCA 0F    RRCA 27     DAA 87     ADD A 27     DAA 4F      LD C,A 78      LD A,B E6 07  AND 07H 91     SUB C 27     DAA E6 0F  AND 0FH 4F      LD C,A 90     SUB B 67      LD H,A 0F    RRCA 84     ADD H E6 0F  AND 0FH 67      LD H,A 79      LD A,C 商を求める部分の演算

  • 氏名における「髙」や「𠮷」や「乭」 | yasuokaの日記 | スラド

    昨日の『読売新聞』夕刊(東京版、第51222号)のトップに「電子行政 名前の漢字集約」という記事を見つけた。 政府は、行政の電子手続きに使う氏名の漢字を現行の約6万文字から、約1万文字に絞り込む方針を固めた。オンライン化を加速するためだ。たとえば、インターネットを使った納税などで氏名を記載する場合、渡边の「边」は「辺」と表記することにする。全国の自治体も足並みをそろえる必要があり、近く指針を公表する。

    quick_past
    quick_past 2018/08/20
    こういうことをやっておきながら、戸籍制度にこだわったり、苗字や名前を簡単に変えさせなかったりするのおかしくないか。
  • 出生届と死亡届における夏時刻の表示方法 | yasuokaの日記 | スラド

    私(安岡孝一)の8月8日の日記に関連して、『民事月報』のバックナンバーをあさっていたところ、第5巻第10号(昭和25年10月)p.56に「戸籍の届出及び記載に関する夏時刻の表示方について」(昭和25年9月7日民事甲第2384号民事局長通達)を見つけた。 夏時刻法(昭和二十三年法律第二十九号)第二條第二項の規定によつて、九月の第二土曜日は二十五時間をもつて一日とされているところ、同日の第二十五時間目中に発生した事件について戸籍の届出及び戸籍の記載に関する時刻の表示方につき疑義を生じている向があるようであるが、この表示は「午後十一時何分(夏時刻)」の振合によることに一定した(なお同日の第二十四時間目までの時刻の表示及び同日の第二十五時間目を終つたとき翌日の午前零時と表示することについては、他の日におけると同じである)。從つて、今後は出生及び死亡の各届出書に記載する事件の発生時分並びに死亡に関す

    quick_past
    quick_past 2018/08/20
    これ公文書全て対応できるの??
  • Re: Unicodeの絵文字のルーツ | yasuokaの日記 | スラド

    私(安岡孝一)の2017年12月21日と2018年3月2日の日記の読者から、シャルコ・アンナの『外国人が目を丸くした日の「絵文字」の豊かさ』(BEST T!MES、2018年6月6日)を読んでみてほしい、との御連絡をいただいた。読んでみたのだが、絵文字歴史に関して書かれた以下の部分が、どうも気になった。 1993年に図2のスマイリーフェイスを含めて、100個以上の絵文字がUnicode1.1の「その他の記号」というブロックに登録されると、ワードの「記号と特殊文字」から選んで打てるようになりました。 Unicodeの「Miscellaneous Dingbats」に、☺☻☹を含む106字が収録されたのは、1991年10月のUnicode 1.0だったりする。でも、この「ワード」って、何のことだろう? この時点でのMS-Wordは、まだUnicode対応しきれてなかったはずだけど?

    quick_past
    quick_past 2018/06/07
    不誠実な嘘を付いてまで日本すげーなんてしたくない
  • 生活保護法第29条において地方税関係情報の提供を求める際の「本人の同意」 | yasuokaの日記 | スラド

    昨日の日記の読者から、厚生労働省社会・援護局保護課長の「生活保護行政を適正に運営するための手引について」(平成18年3月30日社援保発第0330001号、平成26年4月25日社援保発0425第3号で改正)において、人同意を取得するよう「手引」されている、という趣旨の御指摘をいただいた。当該通知の「まとめ」を見てみよう。 ア 生活保護の適用や被保護者の支援に当たって、必要な被保護者の病状を把握するための被保護者の病状調査について、法第50条第1項及び指定医療機関医療担当規程第7条に基づく調査を行い、または、法第50条第2項に基づく指導を行った場合には、人の同意なしに回答(個人情報の提供)を得ることが可能である。 イ 資産や収入の状況等(例:預貯金、生命保険、年金、労災保険等)については、法第29条に基づく関係先調査を行い、これを根拠として回答(個人情報の提供)を得ることが可能である。なお

  • 獨逸とドイツ、孛漏生とプロシヤ | yasuokaの日記 | スラド

    <京都大人文科学研究所付属東アジア人文情報学研究センターの安岡孝一教授(人文情報学)の話> 国名の当て字の由来ははっきりしない部分が多いが、ドイツ(独逸)の場合、「独」と「逸」の2文字に関連性はないことなどから、音読みを拾ったものではないか。 実際のところ、明治2年の条約の時点で、プロシヤは孛漏生、ドイツは獨逸、と書かれている。現在の独逸の表記は、「獨」を「独」に代えているものの、基的には明治政府が当初から使っていた表記で、特に「差別視」があるようには思えない。というあたりまで話したのだけど、さすがに紙面が足りなかったのね。まあ、仕方ないかな。

    獨逸とドイツ、孛漏生とプロシヤ | yasuokaの日記 | スラド
    quick_past
    quick_past 2017/04/04
    暹羅と書いてシャムはムリあると思うんだ(そこじゃない)
  • ヘボン式ローマ字における促音と撥音 | yasuokaの日記 | スラド

    『ISO 3602をヘボン式に改正要求』の読者から、伊澤拓也の『「ti」「chi」どっち? ローマ字、児童混乱 教員ら「一化を」』(毎日新聞[東京], 2017年3月21日, 夕刊p.9)という記事を読んでほしい、との御連絡をいただいた。 さまざまな形式が混在したローマ字を統一するため、昭和初期に文部省(当時)がほぼ母音と子音の2文字で構成する訓令式をまとめた。1954(昭和29)年の内閣告示で現在の訓令式のつづりを正しいローマ字として定める一方、ヘボン式の使用も認めた。 『NかMか』にも書いたが、臨時ローマ字調査会(1930年12月15日~1936年6月26日)において、5年半もの激論の末に「訓令式ローマ字」を決めたのだから、文部科学省としては今更その議論を蒸し返したくないだろう。しかしながら、GHQが出したSCAPIN-2(1945年9月3日)以降、「ヘボン式ローマ字」が日中に広ま

    ヘボン式ローマ字における促音と撥音 | yasuokaの日記 | スラド
    quick_past
    quick_past 2017/03/27
    クルンテープマハナコーンのアルファベット音写とカナ音写にめっちゃくちゃ拘る人思い出した。
  • PC WatchにおけるタイプライターとQWERTY配列 | yasuokaの日記 | スラド

    『「ECONOトリビア」QWERTY記事顚末記』の読者から、山田祥平の『スペースインベーダー襲来』(PC Watch、2016年12月16日)という記事を読んでみてほしい、との御連絡をいただいた。読んでみたのだが、TAITOのスペースインベーダーとは何の関係もなく、QWERTY配列に関するガセネタが無造作に書かれていた。 そもそもキーボードはタイプライターの時代からアームが絡まないようにということでQWERTY配列が決まったわけで、その不自然な配列に人間は自分で慣れるしかなかった過去がある。 『キーボード配列 QWERTYの謎』(NTT出版、2008年3月)にも書いたが、現在のQWERTY配列が現れた1882年時点でのタイプライターは、いわゆるアップストライク式であり、「アーム」などという機構を有しない。「アーム」を有するフロントストライク式タイプライターは、「Daugherty Visi

    PC WatchにおけるタイプライターとQWERTY配列 | yasuokaの日記 | スラド
    quick_past
    quick_past 2016/12/17
    なんつーかドヤりたかったんだろうな・・・
  • Re: MZ-80Kの文字コードはなぜ変態的だったのか | yasuokaの日記 | スラド

    MZ-80Kのチコソシイハキクニマに関して、日発売の『週刊アスキー』(No.1059)に、「MZ-80Kの文字コードはなぜ変態的だったのか」という記事を特別寄稿した(pp.30-31)。この記事を書くにあたって、プログラムをいくつか準備したのだが、以下に示すプログラムはデカすぎて紙面に組めそうになかったため、涙を飲んでボツにした。 21E1E9   LD HL,E9E1H 22E8D3   LD (D3E8H),HL CDE8D3 CALL D3E8H 181E     JR +32 110514150F       QETUO 1712190910       WRYIP 0104070A0C       ADGJL 1306080B2C       SFHK; 1A03020D2E       ZCBM. 18160E2F2D       XVN,/ 23      INC HL 2

  • 大正8年の宜野湾村の地図 | yasuokaの日記 | スラド

    東北大学の外邦図デジタルアーカイブに大正8年測図の与那原1:50000地図があることを御教示いただいた。この地図で見る限り、当時の宜野湾村役場は北緯26度16分5秒東経127度45分25秒附近にあって、現在は普天間基地になっている場所である。ちなみに、現在の宜野湾市役所は北東に3kmほど移っているが、昔も今も市街地の中にあって、田んぼの中というわけではないようだ。 世の中には人文地理学や歴史地理学と呼ばれる研究分野があって、私(安岡孝一)個人もしばしば議論に加えてもらっている。戦前の地図は基的に軍事機密であることが多く、デジタル化して公開するには、それなりにパワーが必要なのだ(cf.『外邦図研究ニューズレター』No.6)。ただ、この手の研究をちゃんとやっておかないと、軍事機密なのをいいことに、アヤシゲな説を唱えるヤカラが跋扈することになる。人文科学教育の意義ってのは、一つはガセネタを叩き

    quick_past
    quick_past 2015/06/29
    "ただ、この手の研究をちゃんとやっておかないと、軍事機密なのをいいことに、アヤシゲな説を唱えるヤカラが跋扈することになる。"
  • 1