qnighyのブックマーク / 2017年2月22日

少ない学習データでも高精度で文字認識　富士通が開発、ディープラーニングを効率化

中国の富士通研究開発中心（FRDC）は2月21日、古文書文字を画像認識するディープラーニングに改良を加え、少ない数の学習データでも高精度で認識できる仕組みを開発したと発表した。従来技術と比べると、1文字当たり約70％少ないデータ数で同じ精度を実現でき、古文書文字を電子化する作業の効率化につながるという。ディープラーニングを用いた従来の文字認識では、あらかじめ文字画像と正解の文字を正しくひも付けたデータを認識エンジンに学習させる。学習するデータが多いほど認識精度は高くなるが、中国の古文書文字だとさまざまな書体がある上に、同じ文字でも字形が異なる場合もあり、十分な量の学習データを用意することが難しかった。新技術では、これまでは正解の文字とひも付かずに学習データに使われていなかった文字画像データも学習に活用。（1）認識エンジンが文字画像に、正解と考えられる「仮の文字ラベル」を与える、（2）そ

はてなブックマーク

タグ

2017年2月22日のブックマーク (2件)

少ない学習データでも高精度で文字認識　富士通が開発、ディープラーニングを効率化

録音録画再生機器のボタン - Wikipedia

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

2017年2月22日のブックマーク (2件)

少ない学習データでも高精度で文字認識 富士通が開発、ディープラーニングを効率化

録音録画再生機器のボタン - Wikipedia

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

少ない学習データでも高精度で文字認識　富士通が開発、ディープラーニングを効率化