タグ

2009年12月25日のブックマーク (1件)

  • ずっと君のターン

    先日のエントリでも書きましたが10月に手書き文字認識を業としている会社に転職しました。 手書き文字の認識・・・と聞くと、MNISTなどの印象から機械学習の練習問題のように感じる人もいるかも知れませんが、実際に事業レベルのものを構築しようとするとそこまで単純ではありません。 特に日語は文字種が多く、漢字、カタカナ、ひらがなのみならず、アルファベット(全角・半角)、丸数字などの特殊文字に至るまで、傾向の異なる多種多様な文字が使用され、その認識は一筋縄では行きません。 そんな中でも、最近特に注目度が高く、かつ認識が難しいとされている文字種が「行間」です。 4分33秒に代表される芸術分野での「行間」の重要性はよく知られるところですが、のみならず、より記号の扱いに厳密と思われる数学や物理学などの分野においても証明の細部が「行間」に記され読者の練習問題となったり、「グッと睨む」ことで「行間」を読み取

    ずっと君のターン