タグ

文字とprogrammingに関するardarimのブックマーク (4)

  • アイヌ語仮名「ㇷ゚」に対する正規表現の罠

    導入 アイヌ語は日語と異なり、閉音節(子音で終わる音節)も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日語に特化したカタカナのような仮名文字で表記する際、鼻音 n は「ン」でなんとかなる(実はそれでもまずい事になっているけどここでは割愛する)が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名(小書き仮名文字)を利用することになっている。 具体的には以下のような特殊仮名文字(通称 アイヌ語仮名)である。 ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか… 問題 r

    アイヌ語仮名「ㇷ゚」に対する正規表現の罠
    ardarim
    ardarim 2023/09/01
    このあたりはどこまで厳密にやるか処理系依存なのか。「ㇷ゚」はそもそも片仮名集合に含まれるのか否か、片仮名とは何かという定義問題にもなってきそうだが
  • 『日本人「だけ」読めないフォント』が本当に日本人だけ読めないのか、ニューラルネットの力を借りて確認してみた - Qiita

    test models. [PATTERN1]: English only. 2015-10-19 08:08:39,112 [INFO] #data: 26 2015-10-19 08:08:39,186 [INFO] correct: v, answer: capsV => RIGHT 2015-10-19 08:08:39,186 [INFO] correct: g, answer: capsT => WRONG 2015-10-19 08:08:39,186 [INFO] correct: s, answer: capsE => WRONG 2015-10-19 08:08:39,187 [INFO] correct: o, answer: capsD => WRONG 2015-10-19 08:08:39,187 [INFO] correct: i, answer: capsZ

    『日本人「だけ」読めないフォント』が本当に日本人だけ読めないのか、ニューラルネットの力を借りて確認してみた - Qiita
  • Hexspeak - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "Hexspeak" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2019年10月) Hexspeakとは、リートスピークと類似の、英語の変わった表記法の一種である。 プログラマは、メモリやデータに「未使用」や「異常データ」といった印をつけるために分かりやすいマジックナンバーを必要としており、この際にHexspeakが作り出された。数字の"0"をアルファベットの"O"に、数字の"1"をアルファベットの"I"に、数字の"5"をアルファベットの"S"に読み替えるといった方法を利用し、16進数の表記に使われる文字 (0123456789ABCD

  • I know the answer (it's 42)

    A blog on coding, .NET, .NET Compact Framework and life in general.... Identifying your Arduino board from code For my IoT project I needed to write code slightly differently for specific Arduino boards. E.g. for... Author: Abhinaba Basu [MSFT] Date: 02/21/2016 ESP8266 Wifi With Arduino Uno and Nano If you are trying to add Wifi connectivity to an existing Arduino project or have serious... Author

    I know the answer (it's 42)
    ardarim
    ardarim 2009/03/04
    Bengaliって手書きだとこうやって書くのかー Devanagari系はだいたいこんな感じなのかな。
  • 1