タグ

ブックマーク / srad.jp/~yasuoka (68)

  • yasuokaの日記: WAVE DASH問題縁起

    Encode - 規格のバグまでは直せませんにコメントしながら思ったのだが、JIS X 0208の1区33点「波ダッシュ」をUnicodeに変換する際、U+FF5EのFULLWIDTH TILDEに変換するのは明らかに間違いだ。この件に関して、私が知る限りのことを、ここに記しておこうと思う。 平成5年度のUCS調査研究委員会WG1において問題となったものの一つが、既存のJISの文字コードとISO/IEC 10646との対応をどうするかだった。JIS X 0208-1990の1区33点「波ダッシュ」に対しては、U+223C、U+223D、U+223E、U+223F、U+301Cが候補となったが、結局U+301Cと対応させることとなった。U+301Cの名前がWAVE DASHだったからである。ただし、ISO/IEC 10646-1:1993のU+301Cの例示字形は、JIS X 0208の「波

  • 漢字の古来の形 | yasuokaの日記 | スラド

    漢字が変更された理由について、JIS規格の改訂作業にかかわった京都大学漢字情報研究センターの安岡孝一・助教授は「漢字の古来の形を重視した国語審議会の答申を新しい規格に反映させたため」と話しています。 「漢字の古来の形」なんて、私、話してないぞ。ちゃんと「旧字体」とか「康煕字典体」って言ったはずだが。そもそも「古来の形」だったら、やっぱり「甲骨文」とかでなきゃダメじゃん。しかも、私のこのインタビュー、「人名用漢字」が2004年に改正されたときに、「2点しんにょうの辻」が「人名用漢字」に追加されたんだけど、「2点しんにょう」で当によかったのか、っていう話だったはずだ。ところが、このニュース画像では「人名用漢字」のところが完全に削除されてしまって、「JIS X 0213」改正の話であるかのようにスリカエられてるし。いったい、どういうつもりなんだろう…。

  • 安岡孝一の日記: ローマ字かな漢字変換

    日本語入力についての追記にコメントしながら思ったのだが、後発の「ローマ字かな漢字変換」が、先発の「親指シフト」や「カナ漢字変換」をシェアの上で追い抜いたのは、実際どういうわけなのだろう。とりあえず私なりに、当時のワープロの仮名漢字変換について、整理してみることにした。 1978年9月 東芝が『TOSWORD JW-10』を発表。JIS C 6233キーボードでカナを入力して漢字に変換。 1980年5月 富士通が『OASYS 100』を発表。親指シフトキーボードでかなを入力して漢字に変換。 1980年12月 キヤノンが『キヤノワード55』を発表。JIS C 6233キーボードでローマ字あるいはカナを入力して漢字に変換。 1981年5月 日電気が『文豪NWP-23N』を発表。JIS C 6233キーボードでカナを入力して漢字に変換。ただし、『NWP-20』シリーズで採用していた3300キーの

  • 安岡孝一の日記: シフトJISの誕生

    清水哲郎の「シフトJIS」って何のためにあるの?(キャリア・ラボIT「文字コードで世界に出る」, 第11回, 2005年11月)を読みながら思ったのだが、「シフトJIS」誕生の過程はあまりに知られていない。特に Windowsの前身にあたるMS-DOS開発時にマイクロソフト社などによって考え出されたのが「JIS漢字のコード領域をごっそり1バイト文字の領域と重ならないコード領域にズラしてしまえ」という方法、すなわち「シフトJISコード」でした という誤解を非常に多く見かけるので、「シフトJIS」誕生に関して私が知る限りのことを、ここに記しておこうと思う。 「シフトJIS」を最初に採用したのは、三菱電機『MULTI 16』搭載の『日語CP/M-86』で、1982年4月20日出荷開始(この時点の『日語CP/M-86』は暫定版)である。この『日語CP/M-86』を開発したのは、マイクロソフト

    FeZn
    FeZn 2006/05/05
    (やっと読んだ)
  • 信号はなぜ「赤・黄・青」? | yasuokaの日記 | スラド

    『信号はなぜ「赤・黄・青」?』(広報けいしちょう, 第13号, 2004年5月12日)での以下の回答があまりにヒドイ気がしたので、ちょっと調べてみた。 はっきりしたことは分かりませんが、今から約160年程前に、イギリスの鉄道会社が「信号として見やすい色は何か」という実験をしたところ、白、赤、緑、青の順で識別しやすいことが分かり、鉄道の信号に赤(危険)と白(安全)の油灯を採用したのが信号の始まりと言われています。 しかし、最も識別しやすいと言われた白色の灯火も、電灯の発達により街路灯と紛らわしくなって白色から緑色に替えられるようになりました。 また、世界初の電気式信号機は大正7年に米国のニューヨーク市5番街に設置されましたが、その時の信号機の色はすでに赤・黄・緑を使用していました。 1920年2月6日のThe New York Timesの記事『5th Av. Traffic to Go S

    FeZn
    FeZn 2006/04/05
     交通信号機の色。緑を「あを」で呼ぶ理由については言及無し。鉄道の停止旗のアカと、その補色としてのミドリ。
  • 安岡孝一の日記: 19世紀のタイプライター

    亀井清の『キーボードの話』(大阪成蹊短期大学こみちカフェ, 2003年11月14日)を読んだが、19世紀のタイプライターに関して全く調査していないのではないか、と思えるようなズサンな内容だった。とりあえず、以下の3点について誤りを指摘する。 そして、ようやく、1874年にタイプライターの実用機が世に出ました。タイプライターは当初は大文字・小文字のキーが別々で沢山のキーが並んでいました。ところがレミントン社でシフト機構が開発され、1つのキーで大文字と小文字が打てるようになり、キーの数が半分になったのです。 最初の実用的タイプライターである『Sholes & Glidden Model』(1873年発売、後の『Remington No.1』)には、大文字だけで小文字は含まれていない。大文字・小文字のキーが別々のタイプライターは『Caligraph No.2』(1882年発売)が最初だが、シフト

    FeZn
    FeZn 2005/10/15
     安岡先生の。
  • 安岡孝一の日記: 経済学者の書くQWERTY配列

    三橋平の『先例主義の科学』(ITmedia Survey、2005年4月26日)を読んだが、経済学者の書くQWERTY配列は、どうしてこうそろいもそろってアヤシゲな内容のステロタイプなのだろう。QWERTY配列に関して何の研究もする気がないのだろうから、まあ仕方がないと言えば仕方ないのだが、コラムの「ご意見・ご感想」に書いても返事すら返ってこなかったので、あえてここに書くことにする。 さらに不思議なもので、キーボードの配列。左上からQWERTと並んでいるがために、タイピングが初心者の人はなぜABCDEで並んでいないのか、とその不親切さを嘆いた方も多いと思います。有名な話ですが、このQWERTはタイプライター全盛時代からの配列。連続して文字を打ち込む際にタイプライターのバーが絡まらないように、と工夫されたものなのです。 QWERTY配列に対する誤解にも書いたが、Christopher Lat

    FeZn
    FeZn 2005/05/05
    QWERTY配列の話
  • yasuokaの日記 | スラド

    2021年12月23日の日記の読者から、NDL古典籍OCR用RoBERTa-small ver.2という単文字日語モデルをお教えいただいた。以前、私(安岡孝一)が作ったroberta-small-japanese-aozora-charを再トレーニングして、TrOCRのデコーダーに使っているらしい。とりあえず、当該モデルをGoogle Colaboratoryで動かしてみよう。 !pip install transformers !test -f model-ver2.zip || curl -LO https://lab.ndl.go.jp/dataset/ndlkotensekiocr/trocr/model-ver2.zip !test -d model-ver2 || unzip model-ver2.zip from transformers import pipeline f

    FeZn
    FeZn 2005/04/25