AdventCalender論文2日目担当のCurryです! 今回は画像の中の文字を見つける技術の昔と最新をまとめました。 意外と文字検出の論文紹介ってないんじゃね!?っていう 画像は参照サイト(各章の先頭のURL)、論文中から引っ張ってきてます 文字検出 画像の中の文字を見つけるのは 文字検出 と呼ばれます。英語では Text Detection とか Text Localization という。 つまりこんなタスク。オレンジ線が文字を囲めてるので、検出ができたと判断できる。 入力画像 出力 文字検出の難しさは、以下のようによく言われる。(いわゆる論文のイントロの謳い文句) 1. 文字の多様性 2. 文字の色 3. 文字のコントラストや背景との混同 4. 文字の大きさが違う 5. 文字の方向(いわゆるアルファベットが斜めになっていたり) ちなみに、、、 文字認識 は文字を判別することなの
![画像の中の文字を見つけるのって今どんな感じなの?まとめてみたんご - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/66798814e3154c6f0a4f105f25eb8eb23094d5fc/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-1150d8b18a7c15795b701a55ae908f94.png%3Fixlib%3Drb-1.2.2%26w%3D1200%26mark%3Dhttps%253A%252F%252Fqiita-user-contents.imgix.net%252F~text%253Fixlib%253Drb-1.2.2%2526w%253D840%2526h%253D380%2526txt%253D%2525E7%252594%2525BB%2525E5%252583%25258F%2525E3%252581%2525AE%2525E4%2525B8%2525AD%2525E3%252581%2525AE%2525E6%252596%252587%2525E5%2525AD%252597%2525E3%252582%252592%2525E8%2525A6%25258B%2525E3%252581%2525A4%2525E3%252581%252591%2525E3%252582%25258B%2525E3%252581%2525AE%2525E3%252581%2525A3%2525E3%252581%2525A6%2525E4%2525BB%25258A%2525E3%252581%2525A9%2525E3%252582%252593%2525E3%252581%2525AA%2525E6%252584%25259F%2525E3%252581%252598%2525E3%252581%2525AA%2525E3%252581%2525AE%2525EF%2525BC%25259F%2525E3%252581%2525BE%2525E3%252581%2525A8%2525E3%252582%252581%2525E3%252581%2525A6%2525E3%252581%2525BF%2525E3%252581%25259F%2525E3%252582%252593%2525E3%252581%252594%2526txt-color%253D%252523333%2526txt-font%253DHiragino%252520Sans%252520W6%2526txt-size%253D54%2526txt-clip%253Dellipsis%2526txt-align%253Dcenter%25252Cmiddle%2526s%253D358c608ad241278cba00a94016114b5c%26mark-align%3Dcenter%252Cmiddle%26blend%3Dhttps%253A%252F%252Fqiita-user-contents.imgix.net%252F~text%253Fixlib%253Drb-1.2.2%2526w%253D840%2526h%253D500%2526txt%253D%252540yoyoyo_%2526txt-color%253D%252523333%2526txt-font%253DHiragino%252520Sans%252520W6%2526txt-size%253D45%2526txt-align%253Dright%25252Cbottom%2526s%253D2882f6c1377b19c2e0b92b622e9aac93%26blend-align%3Dcenter%252Cmiddle%26blend-mode%3Dnormal%26s%3De0c6fd8df276b5c1cad575aaee89a74c)