タグ

ブックマーク / srad.jp/~yasuoka (4)

  • 日本の法令における「一日」と「二十四時間」 | yasuokaの日記 | スラド

    ネットサーフィンしていたところ、『東京五輪終わっても「サマータイム」恒久的運用へ』(スポーツ報知、2018年8月8日)という記事に、面白いことが書いてあるのを見つけた。 ◆夏時間への切り替え方 導入初日を4月の最初の日曜日とした場合は午前2時に2時間進め午前4時に合わせる。夏時間が始まる日曜日は1日が22時間になる。10月最後の日曜日をサマータイムが終わる日とした場合は午前4時に2時間戻し午前2時に合わせる。この日は1日が26時間となる。 いや、それは、かなりマズイことになると思う。現在の日の法令は、そのほとんどが「一日」を「二十四時間」だと仮定していて、しかも、同じ時刻が二度存在しないことを、大前提としているからだ。たとえば、戸籍法施行規則第二十一条第七号。

  • 石井茂吉の「次」と「黑へん」 | yasuokaの日記 | スラド

    先日の『もじもじカフェ』の懇親会で、つい石井茂吉を批判してしまったところ、ぜひ蒸し返してほしい、との御依頼をいただいた。まあ、あまりネタがたくさんあるわけではないのだが、以前『姿と恣と盗』でも発表したとおり、石井明朝体の「次」に関しては正直なところ全く納得がいかない。現代において「姿」と「恣」と「盗」がこんなことになってしまったのは、やはり石井茂吉に責任の一端があると思う。ただ、これは『当用漢字字体表』という不幸な時期に重なっていたこともあって、石井茂吉だけが悪いわけではない。時代の波に翻弄された、とも言えるだろう。 しかし、どう考えても納得がいかないのが「黑へん」だ。昔の日記にも少し書いたが、『大漢和辞典』の48041~48247の「黑へん」のうち、48052・48079・48081・48108・48117のデザインが明らかに違う。こんなの並べてみたら当然、気がついたはずなのに、ほったら

  • 日本IT界の鬼っ子「外字問題」解消プロジェクト | yasuokaの日記 | スラド

    経産省が動いたのは、官民ともにインターネットによる電子的な手続きの導入が進むなか、正しい人名表記を扱う必要に迫られると考えたためだ。法務省が幅広い電子化を目指して04年にまとめた「戸籍統一文字」(5万6040字)をもとに5万8713字のデータベースを作る。 とあってズッコケた。いや、それ、去年の8月に公募していた文字情報基盤構築に関する研究開発事業のことで、翌月には発足したんだけど。 委員として参画している私(安岡孝一)が言うのも何だが、この事業で「外字問題」は少しは楽になるかもしれないけど、決して解消するわけではない。たとえば戸籍統一文字の552700は、この58713字には含まれていない。というのも、戸籍統一文字は56040字から3字増えて現在は56043字になっているが、増えた3字のうち552700「⿳宀癶山」は、現時点ではこの事業の対象になっていないからだ。 だったら「⿳宀癶山」を

    cu39
    cu39 2011/01/22
  • yasuokaの日記 | スラド

    2021年12月23日の日記の読者から、NDL古典籍OCR用RoBERTa-small ver.2という単文字日語モデルをお教えいただいた。以前、私(安岡孝一)が作ったroberta-small-japanese-aozora-charを再トレーニングして、TrOCRのデコーダーに使っているらしい。とりあえず、当該モデルをGoogle Colaboratoryで動かしてみよう。 !pip install transformers !test -f model-ver2.zip || curl -LO https://lab.ndl.go.jp/dataset/ndlkotensekiocr/trocr/model-ver2.zip !test -d model-ver2 || unzip model-ver2.zip from transformers import pipeline f

    cu39
    cu39 2011/01/16
  • 1