ブックマーク / srad.jp/~yasuoka (243)

  • 東ロボは漢文に返り点を打つことができたのか | yasuokaの日記 | スラド

    私(安岡孝一)の11月12日の日記の読者から、「ロボットは東大に入れるか」(東京大学出版会、2018年9月)を読んでみてほしい、との御連絡をいただいた。読んでみたところ、67ページに 大学入試の「国語」は,現代文,古文,漢文の3つに分けられる.このうち,古文と漢文は,受験生にとってほとんど外国語のようなものであり,外国語と同じように単語や文法を覚え,現代日語に翻訳する能力を身につけることが,主要な対策となる.実際,古文や漢文の問題は,単語や文法の知識を問う問題や現代文に翻訳する問題,および,それに基づく内容理解の問題が出題されるため,このような対策は有効であり,コンピュータで解く場合でも,同様のアプローチをとることになる.

    zu2
    zu2 2018/11/30
  • 漢文に返り点を打つタスク | yasuokaの日記 | スラド

    昨日の日記で「漢文に返り点を打つタスク」と書いたところ、返り点にも流派のようなものがあるのではないか、という趣旨の御意見をいただいた。まあ、それもあって、今回、私(安岡孝一)の『漢文の依存文法解析と返り点の関係について』(日漢字学会第一回研究大会(2018年12月1日)発表予定)では、『漢文大系』(冨山房、1909~1916年)の「孟子定」とだけ対照している。卷一のアタマを見てみよう。 孟子見㆓梁惠王㆒ 王曰 叟不㆑遠㆓千里㆒而來 亦將㆑有㆔以利㆓吾國㆒乎 孟子對曰 王何必曰㆑利 亦有㆓仁義㆒而已矣 王曰㆔何以利㆓吾國㆒ 大夫曰㆔何以利㆓吾家㆒ 士庶人曰㆔何以利㆓吾身㆒ 上下交征㆑利而國危矣 萬乘之國 弑㆓其君㆒者 必千乘之家 千乘之國 弑㆓其君㆒者 必百乘之家 萬取㆑千焉 千取㆑百焉 不㆑爲㆑不㆑多矣 苟爲㆓後㆑義而先㆒㆑利 不㆑奪不㆑饜 未㆑有㆘仁而遺㆓其親㆒者㆖也 未㆑有㆘義而後

    zu2
    zu2 2018/11/14
  • Z80におけるPaethの回転行列 | yasuokaの日記 | スラド

    一昨日・昨日の日記を読み返しながら、イキオイ余ってPaethの回転行列を、Z80で汎用的に実装してしまった。IXレジスタにx座標の256倍を、IYレジスタにy座標の256倍を、HLレジスタに-tan(θ/2)の16384倍を、DEレジスタにsinθの16384倍を、それぞれ符号付整数で入れて呼び出すと、θだけ回転(ただし-2π/3≦θ≦2π/3)した結果がIX,IYレジスタに返ってくる。 06 03     LD B,3 DD E5   PUSH IX FD E5   PUSH IY E5      PUSH HL CB 40    BIT 0,B D9       EXX C1       POP BC D1       POP DE E1       POP HL 20 01     JR NZ,+3 EB        EX DE,HL CB 21    SLA C CB 10   

    zu2
    zu2 2018/10/18
  • Z80における「手抜き」回転行列 | yasuokaの日記 | スラド

    ネットサーフィンしていたところ、このtweetで35年ほど前の悪行がバラされてしまっていたので、当時の記憶を辿りつつ、ざっと書いてみようと思う。 画面中心を(0,0)とするxy座標系において、適当な微小角度θで回転をおこないたい。θの値は、まあ何でも良くて、とにかく見た目が「回って」いる雰囲気を出したい。ただ、対象とするCPUがZ80なので、乗算は自分で実装するしかなく、そのあたりの「手抜き」を考える。 微小角度θにおいてcosθは1に近い値なので、ここの実装を簡単にすべく、とりあえずcosθ=1-2-kとしてみる。そうすると、sin2θ=2(1-k)-2-2kとなるので、小さい方の項を捨てれば、だいたいsinθ≒2(1-k)/2。つまり、kが奇数なら実装が簡単となり、たとえばk=7なら、cosθ=127/128, sinθ≒1/8となる。 HLレジスタのHレジスタに符号付整数、Lレジスタ

    zu2
    zu2 2018/10/10
  • 安岡孝一の日記: タイプライターのシフト機構

    矢沢久雄の『キーボードが複雑怪奇な理由』(日経パソコン, No.504 (2006年4月24日), p.165)を読んだが、19世紀のタイプライターを全く調査していないらしく、間違いだらけの内容だった。特に、タイプライターのシフト機構に関する以下のくだりは、間違いにしてもあまりにもヒドイ。 特殊なキーの名称の由来の多くは、タイプライター時代の名残りです。Shiftは「ずらす」という意味です。タイプライターの一つひとつのアームには、アルファベットの大文字と小文字の両方が刻まれています。通常の入力では小文字が印字され、Shiftキーを押しながら入力すると、アームが持ち上がって大文字が印字されます。 機械式タイプライターでは、Shiftキーが持ち上げるのはプラテン(紙を巻きつけるローラー)の方だ。アームが持ち上がったりはしない。しかも、「持ち上げる」のなら「Shift」ではなく「Lift」だ。こ

    zu2
    zu2 2018/10/06
  • 「⿺辶鳥」は“ナベ”の異体字なのか | yasuokaの日記 | スラド

    漢字ミュージアムで開かれていた「異体字の世界ワタ“ナベ”」が、日、無事に終了した。私(安岡孝一)は、この企画展示の監修を引き受けたのだが、“ナベ”の異体字に「⿺辶鳥」を紛れ込ませられなかった、というのを今日の日記で懺悔しておく。まあ、IPAの後援ということもあったので、戸籍統一文字と住民基台帳ネットワーク統一文字に留めておいて、登記統一文字にまでは手が出せなかったのだ。でも、IPAmj明朝は、もはや新たな漢字の収録はおこなえなさそうだし、さて「⿺辶鳥」は、どうしたらいいんだろ。

    zu2
    zu2 2018/09/05
  • AZERTY配列はフランス語を打てないのか | yasuokaの日記 | スラド

    『キーボード配列 QWERTYの謎』(NTT出版、2008年3月)の読者から、中村亮一の「アルファベットのキー配列-QWERTY配列がデファクトスタンダードになっているのはなぜか-」(ニッセイ基礎研究所、2018年9月3日)を読んでほしい、との連絡をいただいた。読んでみたのだが タイプライターのQWERTY配列の開発及びその後の進展等を巡る状況に関しては、「キーボード配列QWERTYの謎」(安岡幸一、安岡素子著)NTT出版(以下、「安岡著書」という)に詳しい内容が紹介されている。

    zu2
    zu2 2018/09/05
    “その本の著者の一人は、私「安岡孝一」だ。「安岡幸一」じゃない。イラっときたので、ざっと吊るし上げてみようと思う”
  • 働き方改革の壁におけるQWERTY配列の歴史 | yasuokaの日記 | スラド

    私(安岡孝一)の『パソコンのキーボードは,なぜABC順・五十音順ではないのですか』の読者から、安田洋祐の『経済学で読み解く「働き方」と「イノベーション」』を読んでほしい、との御連絡をいただいた。読んでみたのだが、またもやQWERTY配列に対するガセネタがバラ撒かれていて、かなり閉口した。 皆さんが普段使うキーボードはQWERTY型のキー配列です。しかし、この配列は実はタイピングに向いていません。タイプライター時代に文字のハンマーの絡みを起こさないよう、よく使うアルファベットキーを離したため、このような配置になったと言われています。では、なぜ改善されなかったのか。ユーザーもメーカーも、その状態から抜けるインセンティブがなかったからです。 『「ECONOトリビア」QWERTY記事顚末記』でも明らかにしたが、よく使う「E」と「R」のキーは、QWERTY配列において隣り合っている。離れてなどいない

    zu2
    zu2 2018/08/19
    “安田洋祐の『経済学で読み解く「働き方」と「イノベーション」』を読んでほしい、との御連絡をいただいた。読んでみたのだが、またもやQWERTY配列に対するガセネタがバラ撒かれていて、かなり閉口した”
  • 氏名における「髙」や「𠮷」や「乭」 | yasuokaの日記 | スラド

    昨日の『読売新聞』夕刊(東京版、第51222号)のトップに「電子行政 名前の漢字集約」という記事を見つけた。 政府は、行政の電子手続きに使う氏名の漢字を現行の約6万文字から、約1万文字に絞り込む方針を固めた。オンライン化を加速するためだ。たとえば、インターネットを使った納税などで氏名を記載する場合、渡边の「边」は「辺」と表記することにする。全国の自治体も足並みをそろえる必要があり、近く指針を公表する。

    zu2
    zu2 2018/08/19
  • Re: 氏名における「髙」や「𠮷」や「乭」 | yasuokaの日記 | スラド

    秋田県立図書館で『読売新聞』をチェックしていたところ、8月17日朝刊(東京/秋田版、第51223号)p.2に「名前 漢字絞り込み」という記事を見つけた。8月16日夕刊の記事のダイジェスト版のようだが、ダイジェストしすぎて、一部が誤報と化している。特に以下の部分。 ただ、氏名に使われている約6万文字のうち、日工業規格(JIS)でコード化されたのは1万50文字しかなく、多くの自治体は「外字」と呼ばれる特別な文字を作ってデータ入力している。 その「1万50文字」が、JIS X 0213の第1・第2・第3・第4水準漢字のことだとすると、JIS X 0212やJIS X 0221を無視するのは、かなりヒドイと思う。「坥」とか「珵」とかJIS X 0212でコード化されてる漢字を、見たことが無いのだろうか。あるいは「髙」とか「𠮷」とか「乭」とか、JIS X 0221でコード化されてる漢字を、見たこ

    zu2
    zu2 2018/08/19
  • 出生届と死亡届における夏時刻の表示方法 | yasuokaの日記 | スラド

    私(安岡孝一)の8月8日の日記に関連して、『民事月報』のバックナンバーをあさっていたところ、第5巻第10号(昭和25年10月)p.56に「戸籍の届出及び記載に関する夏時刻の表示方について」(昭和25年9月7日民事甲第2384号民事局長通達)を見つけた。 夏時刻法(昭和二十三年法律第二十九号)第二條第二項の規定によつて、九月の第二土曜日は二十五時間をもつて一日とされているところ、同日の第二十五時間目中に発生した事件について戸籍の届出及び戸籍の記載に関する時刻の表示方につき疑義を生じている向があるようであるが、この表示は「午後十一時何分(夏時刻)」の振合によることに一定した(なお同日の第二十四時間目までの時刻の表示及び同日の第二十五時間目を終つたとき翌日の午前零時と表示することについては、他の日におけると同じである)。從つて、今後は出生及び死亡の各届出書に記載する事件の発生時分並びに死亡に関す

    zu2
    zu2 2018/08/16
    “夏時刻が終わるまさにその1時間だけ「(夏時刻)」って書くのは、運用上かなりマズイ気がするのだけど、どうもそういうことのようである”
  • 日本の法令における「一日」と「二十四時間」 | yasuokaの日記 | スラド

    ネットサーフィンしていたところ、『東京五輪終わっても「サマータイム」恒久的運用へ』(スポーツ報知、2018年8月8日)という記事に、面白いことが書いてあるのを見つけた。 ◆夏時間への切り替え方 導入初日を4月の最初の日曜日とした場合は午前2時に2時間進め午前4時に合わせる。夏時間が始まる日曜日は1日が22時間になる。10月最後の日曜日をサマータイムが終わる日とした場合は午前4時に2時間戻し午前2時に合わせる。この日は1日が26時間となる。 いや、それは、かなりマズイことになると思う。現在の日の法令は、そのほとんどが「一日」を「二十四時間」だと仮定していて、しかも、同じ時刻が二度存在しないことを、大前提としているからだ。たとえば、戸籍法施行規則第二十一条第七号。

    zu2
    zu2 2018/08/09
    “「サマータイムが終わる日」の「午前2時5分」に死亡した人は、「最初の午前2時5分」か「2回目の午前2時5分」なのかをちゃんと記録しないと、死亡の前後関係が狂ってしまって、相続関係に問題が生じる”
  • Adobe-Japan1-6にないJIS X 0212の漢字 | yasuokaの日記 | スラド

    Ken Lundeの「Adobe-Japan1-6 Is Expecting!」(CJK Type Blog, 2018年7月20日)を読みながら、13年前にKenに送ったメールのことを思い出したので、忘れないうちに今日の日記に書いておこうと思う。JIS X 0212-1990の漢字のうち、38-11「殩」にあたる字体は、Adobe-Japan1-6に含まれていない。よく似た字体としてCID=16923があるのだが、上の部品が「歹」ではなく「歺」なので、異体字ではあるものの字体が異なっている。34-43「暀」もCID=17749と微妙に異なっているし、38-68「汴」もCID=16928と微妙に異なっている。 ただ、今回のAdobe-Japan1-7は、どうやら「元号」の追加だけにとどまりそうな気配である。「near-identical twins」って書いてあるところを見ると、横組用と縦

    zu2
    zu2 2018/08/02
  • MIT Technology Reviewの考えるQWERTY配列 | yasuokaの日記 | スラド

    私(安岡孝一)の『パソコンのキーボードは,なぜABC順・五十音順ではないのですか』の読者から、Mariana Mazzucatoの『デジタル経済を独占するグーグルやフェイスブックと私たちはどう付き合うべきか』(MIT Technology Review、2018年7月7日)を読んでみてほしい、との御連絡をいただいた。読みかけてみたのだが、いきなりQWERTY配列に対するガセネタが書かれていて、とても有料の部分まで読む気になれなかった。 キーボードのQWERTY配列は、タイプライターの機械式アームがぶつかって絡まるトラブルを減らすために、わざと非効率的に設計された。この特性はもはや現在のキーボードには無関係だが、人々はそんなことにはお構いなく、まだQWERTY配列のキーボードを使っている。 タイプライターに「アーム」という機構が導入されたのは、1893年発売の「Daugherty Typew

    zu2
    zu2 2018/07/07
    “つまり、おせっかいな訳者が「アーム」などという単語を導入して、完全な誤訳にしてしまった、ということだろう”
  • 「胱」「腥」「腟」は人名用漢字なのか | yasuokaの日記 | スラド

    ネットサーフィンしていたところ、呉智英の『「暴走万葉仮名」の分析に計量社会学者は立ち上がるべき』(NEWSポストセブン、2018年7月2日)という、ワケのわからない記事に行き当たった。タイトルからして計量言語学と計量社会学を混同している上に、中身はもっとワケがわからない。 1951年、日の戸籍に子の名前として記載できる漢字が定められた。当初は100文字に満たない漢字しかなかったが、徐々に増加、現在は800文字超ある。 「子の名に使える漢字」のことを言いたいのだろうが、1951年5月25日の時点だと、当用漢字表1850字、当用漢字字体表1850字、人名用漢字別表92字が「子の名に使える漢字」となっていた。ちなみに、2017年9月25日現在で2999字になってるんだけど、「現在は800文字超ある」って何の話だろう? ところで、私には吉川のような計量社会学者にこそ調査研究してもらいたいテーマが

    zu2
    zu2 2018/07/04
    “タイトルからして計量言語学と計量社会学を混同している上に、中身はもっとワケがわからない”
  • 1874年発売の「Sholes & Glidden Type-Writer」は、1872年の『Scientific American』に掲載可能か? | yasuokaの日記 | スラド

    と書いてあるのだ。1874年4月発売の「Sholes & Glidden Type-Writer」の絵が、1872年8月10日の『Scientific American』に掲載されているわけで、どう考えても話がおかしい。 実のところ、これら2つのタイプライターは、全く異なるモデルだ。端的に言えば、1872年のモデルは文字キーの数が42だが、1874年のモデルはキー数が44に増えている。1872年のモデルは小机を改造して台座にしているが、1874年のモデルはミシン台である。そして、1872年のモデルは筐体が木製だが、1874年のモデルはネズミ鋳鉄である。 ただ、この記事の最も妙なところは、『かつて“2より小さい数字が打てないキーボード”が存在した理由』というタイトルなのに、文中に「理由」が書かれていない点だろう。Sholesの「1869年10月18日」付けの手紙とか、見たことないのかしら?

    zu2
    zu2 2018/06/11
  • Re: Unicodeの絵文字のルーツ | yasuokaの日記 | スラド

    私(安岡孝一)の2017年12月21日と2018年3月2日の日記の読者から、シャルコ・アンナの『外国人が目を丸くした日の「絵文字」の豊かさ』(BEST T!MES、2018年6月6日)を読んでみてほしい、との御連絡をいただいた。読んでみたのだが、絵文字歴史に関して書かれた以下の部分が、どうも気になった。 1993年に図2のスマイリーフェイスを含めて、100個以上の絵文字がUnicode1.1の「その他の記号」というブロックに登録されると、ワードの「記号と特殊文字」から選んで打てるようになりました。 Unicodeの「Miscellaneous Dingbats」に、☺☻☹を含む106字が収録されたのは、1991年10月のUnicode 1.0だったりする。でも、この「ワード」って、何のことだろう? この時点でのMS-Wordは、まだUnicode対応しきれてなかったはずだけど?

    zu2
    zu2 2018/06/07
    “『外国人が目を丸くした日本の「絵文字」の豊かさ』という記事は、『絵文字進化論』という連載記事の第1回らしい。まあ、第2回以降でちゃんと訂正が入るのを、私としては期待するのだけど、さて、どうなるかしら”
  • 「だぢづでど」と「ざじずぜぞ」の対立 | yasuokaの日記 | スラド

    『大漢和辞典』を読んでいて、検字番号4890「地」に「ヂ」という音を、見つけた。そう言えば、私(安岡孝一)が多感な少年期を過ごした岸和田は、「だぢづでど」と「ざじずぜぞ」が、発音上あまり対立していない地域だったように思える。「地震」と「自信」の発音が同じなのは、まあ、よくあることだと思うのだが、「臀部」と「全部」の発音が同じなのは、今にして思うと少しマズイ気がする。「道理」と「草履」の発音も聞き分けにくく、そのせいか「草履」のことを「雪駄」と呼ぶことも多かった。ただ、私が高校に進学した1980年代頃には、「だでど」と「ざぜぞ」は、発音が少しずつ対立していったような気がする。それでも、いまだに「ぢづ」と「じず」の発音は、分離していないと思われる。

    zu2
    zu2 2018/05/27
  • 「くゎ」と「か」の対立 | yasuokaの日記 | スラド

    『大漢和辞典』を読んでいて、検字番号41297「関」に「クワン」という音が示されているのを、見つけた。ちなみに「カン」という音は示されていない。実は、私(安岡孝一)の祖母の一人は、合拗音「くゎ」と直音「か」を対立させて発音する人で、火事(くゎじ)と家事(かじ)を自然に言い分けていたのが、子供心にも不思議だったのだ。ただ、祖父の発音にそういう対立は無かった(気がする)ので、あるいは祖母だけだったのかもしれない。なお、『大漢和辞典』では、検字番号18850「火」には「クワ」という音が、検字番号7169「家」には「カ」「ケ」「コ」という音が、それぞれ示されている。

    zu2
    zu2 2018/05/24
  • 授業目的公衆送信補償金にかかる著作権法の改正 | yasuokaの日記 | スラド

    昨日付で参議院の文教科学委員会に付託された「著作権法の一部を改正する法律案」だが、授業目的公衆送信補償金のところが、私(安岡孝一)個人としては問題になりそうだ。とりあえず、改正後の第35条を見てみよう。 (学校その他の教育機関における複製等) 第三十五条 学校その他の教育機関(営利を目的として設置されているものを除く。)において教育を担任する者及び授業を受ける者は、その授業の過程における利用に供することを目的とする場合には、その必要と認められる限度において、公表された著作物を複製し、若しくは公衆送信(自動公衆送信の場合にあつては、送信可能化を含む。以下この条において同じ。)を行い、又は公表された著作物であつて公衆送信されるものを受信装置を用いて公に伝達することができる。ただし、当該著作物の種類及び用途並びに当該複製の部数及び当該複製、公衆送信又は伝達の態様に照らし著作権者の利益を不当に害す

    zu2
    zu2 2018/05/10
    “授業に使ったPDFとかPPTを、学生にURLを教えてダウンロードできるようにすると、「学校その他の教育機関」は「相当な額の補償金を著作権者に支払わなければならない」ということになる”