タグ

2023年5月11日のブックマーク (4件)

  • 文字コード | 衆議院議員 河野太郎公式サイト

    2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。 ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55,270文字もあります。 全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を2011年に策定し、それにあわせたフォントを作成し、無償で提供しています。 この「文字情報基盤」(MJ)には、58,862文字が含まれています。 しかし、このMJを全庁的に採用している自治体は、川口

    文字コード | 衆議院議員 河野太郎公式サイト
    Imamu
    Imamu 2023/05/11
    「行政には戸籍文字以外のさまざまな文字も使われています。例えば在留カードなどの外国人氏名に使われている入管文字、官報に使われている官報文字、登記に使われている法人名等に使われている登記固有文字など」
  • 【書評】『土偶を読む』人文知と情報論的知の対話の可能性を持つ貴重な試み

    書評】『土偶を読む 130年間解かれなかった縄文神話の謎』/竹倉史人・著/晶文社/1870円 【評者】大塚英志(まんが原作者) 考古学や縄文研究の非アカデミシャンによって書かれた書の憤る、アカデミズムのいやらしいほどの排他性を著者以上に身を以て日々経験している身としては、その正当性に限れば誰より深く同意する。しかし書を実際に読んでみるとそこにあるのは在野VSアカデミズムだけでなく、人文知と情報論的知の乖離という、もう一つの問題ではないか、とも感じた。 書へのアカデミズムの側の批判として説得力を持つのは土偶のモチーフの変遷、つまりその様式がいかなるプロセスで成立してきたかという考古学の蓄積が無視されている点だ。 デザイン的に「シンプルな造形」を任意に「原型」を設定することは、AIの研究者などがローデータを入力するための枝葉を落とし整理する手続きにそれこそ「似て」いる。カタチをデジタル

    【書評】『土偶を読む』人文知と情報論的知の対話の可能性を持つ貴重な試み
    Imamu
    Imamu 2023/05/11
    「在野VSアカデミズムだけでなく、人文知と情報論的知の乖離という、もう一つの問題」
  • 【直撃】あの伝説のバンドに「 ビジュアル系って呼ばれてどう思ってたの?」って聞いてみた

    【直撃】あの伝説のバンドに「 ビジュアル系って呼ばれてどう思ってたの?」って聞いてみた 亀沢郁奈 2023年5月9日 90年代の後半ごろ「ビジュアル系ブーム」という、蜃気楼みたいな一瞬の輝く時代があった。それっぽいバンドは以前からいたハズなのだが、なんか急にそう呼ばれるようになったのである。誰が呼んだか知らないが。 ただ、私(当時中学生)を含む そのテのバンドを支持する者の間では “その呼び名” をあえて避ける動きがあった。なぜなら当のバンドさんたちが “その呼び名” を気に入っているようには、お世辞にも、全然見えなかったからだ。あれ、実際のところはどうだったんだろ? そんな悩めるオールド・バンギャな私であるが、今回なぜか我がゴッドオブ青春ことFANTASTIC◇CIRCUSさんに会えることになったぞ。理由は不明だ。 ・なぜ出てくれたのか 一応ご説明しておくとFANATIC◇CRISIS(

    【直撃】あの伝説のバンドに「 ビジュアル系って呼ばれてどう思ってたの?」って聞いてみた
    Imamu
    Imamu 2023/05/11
    FANATIC♢CRISIS
  • ChatGPTは文字コードをどのように解釈しているか Unicodeの「日本語認識」「括弧の抽出」「旧字体と新字体の変換」を実験してみた

    「YAPC(Yet Another Perl Conference)」は、Perlを軸としたITに関わるすべての人のためのカンファレンスです。ライトニングトークにはPR TIMES インターンのShun氏が登壇。ChatGPTと文字コードについて話します。 ChatGPTは文字コードをどのように解釈しているか 土屋俊介氏:こんにちは。先ほど、発表が4分だと知った土屋です。PR TIMESというところで、機械学習のインターンをしています。 (スライドを示して)昨今、ChatGPTというものがメチャメチャはやっていますよね。私は使っていく中で、(ChatGPTが)文字コードをどのように解釈しているかが気になりました。なぜそんなニッチな話が気になるのかというと、自然言語処理とWebに関わっている以上、文字コードに関するプログラムをよく書くんです。その関係で気になったので調べてみました。 (スライ

    ChatGPTは文字コードをどのように解釈しているか Unicodeの「日本語認識」「括弧の抽出」「旧字体と新字体の変換」を実験してみた