エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
バクラクのデータセットを用いた項目領域推定とレイアウト情報の重要性 - LayerX エンジニアブログ
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
バクラクのデータセットを用いた項目領域推定とレイアウト情報の重要性 - LayerX エンジニアブログ
こんにちは。機械学習エンジニアの上川です。本記事では、バクラクのデータを用いて書類上の項目領域を... こんにちは。機械学習エンジニアの上川です。本記事では、バクラクのデータを用いて書類上の項目領域を推定する物体検出モデルを構築し、項目領域の推定におけるレイアウト情報の重要性について考察を行ったので、その紹介をします。 AI-OCRにおけるレイアウト情報の重要性 弊社のバクラクにはAI-OCRという機能があり、請求書や領収書などの書類から支払い金額や書類日付、取引先名などの項目内容をサジェストすることによって、お客様が手入力する手間を省いています。 この過程では、書類上のどこにどのような項目が存在するのかを推定することが必要です。 そのため、書類から項目の領域を推定する際に、単に文字を認識するだけでなく、書類のレイアウトを理解することがAI-OCRにおいて非常に重要です。 支払い金額、書類日付、取引先名などの項目が、様々なレイアウトの書類においてどこに配置されうるのかという傾向を正確に把握す