■イベント :【SenseTime Japan × Sansan】画像処理勉強会 https://sansan.connpass.com/event/230636/ ■登壇概要 タイトル:深層学習時代の文字認識とその周辺 発表者: 技術本部 DSOC R&D研究員 宮本 優一 ▼Twitter https://twitter.com/SansanRandD
タイトルの通り、8/10-27の3週間Rettyの広告コンテンツチームでインターンをさせていただきました。かなりたくさんのことを行い、考えてきたので思考プロセスって言ったら大げさなんですけど笑備忘録を書かせていただきます。 自己紹介 インターンのタスク タスクの目的 具体的な内容 手法の選定 Vision APIの使用について 機械学習モデルの構築 学習用画像のアノテーション 機械学習の前準備 ResNetとは? 学習スタート! 推論 Endpoint 作成 OCRを行う 形態素解析とは 形態素解析を行った 今後の方向性 今回使用しなかったデータへの範囲拡大 OCRのパラメータについて インターン中の業務以外に関して 感想 Rettyでインターンをしたい人へ 最後に 自己紹介 東京工業大学大学院情報理工学院 数理・計算科学系1年生の森脇と申します。大学院の方では分散学習の研究を行っておりま
R&D チームの徳田(@dakuton)です。 最近は画像とテキストの狭間にいます。 今回記事のまとめ 簡単にまとめると以下のとおりです。 いくつかの超解像(高解像度化)モデルがOpenCV extra modules(opencv_contrib)インストール + コード数行記述で導入可能 超解像に限らず、文字が一定サイズ以上になるような前処理 -> OCR解析 を実施すると、OCR精度改善につながることがある 超解像による見た目の滑らかさに比例して、OCR精度改善につながるわけではない 低計算コストな画像拡大から超解像に変更する恩恵は発生しにくい テスト条件を変えた場合、違った結果になる可能性あり(用いるOCRエンジン、画像の劣化条件、OpenCV未提供の後発モデル利用など) 実験内容 利用するOCRエンジンの実行条件は変えずに、前処理部分のみ変更した場合のOCR精度・速度変化を調べま
Online OCRとは Online OCRは、46ヶ国の言語に対応して画像からテキストを抽出することができる無料のオンラインOCRツールです。 登録なしでの利用 現在、登録なしの状態で、15MBまでなら以下の形式の単一ファイルを読み込むことができます。 PDF (単一ページ) TIF/TIFF (単一ページ) JPEG/JPG BMP PNG GIF そして、以下の形式で出力することができます。 Microsoft Excel (xlsx) Microsoft Word (docx) プレーンテキスト (txt) 登録なしでも、ライトユーザーであれば十分すぎるくらい便利です。 無料登録をすると Online OCRは、登録しなくても十分便利なのですが、無料登録を行うことにより、さらにできることの幅が広がります。 以下の形式のファイルを200MBまで読み込むことができるようになります。
에버노트에 뭐가 새로워요?에버노트에서 무슨 일이 일어나고 있는지 궁금하신가요? 아래의 기사들을 확인하여 우리가 작업 중인 흥미로운 것들을 모두 볼 수 있습니다. 새로운 소식레거시 버전 Evernote 앱 사용 중지2024년 3월 26일, 저희는 레거시 버전 Evernote 앱에 작별을 고합니다. v10 이전의 Evernote 경험을 단일화하면 보안 수준을 크게 높이고 더 빠른 개발을 위해 더 많은 자원을 투입할 수 있습니다. 더 읽기 14가지 주요 기능이 이제 모든 사용자에게 제공됩니다이 중요한 Evernote 기능들은 검색, 첨부 관리, 노트 액세스 등 핵심적인 제품 성능을 높여줍니다. 이제 누구나 그 기능을 사용해 Evernote의 잠재성을 최대한 활용할 수 있습니다.
에버노트에 뭐가 새로워요?에버노트에서 무슨 일이 일어나고 있는지 궁금하신가요? 아래의 기사들을 확인하여 우리가 작업 중인 흥미로운 것들을 모두 볼 수 있습니다. 새로운 소식레거시 버전 Evernote 앱 사용 중지2024년 3월 26일, 저희는 레거시 버전 Evernote 앱에 작별을 고합니다. v10 이전의 Evernote 경험을 단일화하면 보안 수준을 크게 높이고 더 빠른 개발을 위해 더 많은 자원을 투입할 수 있습니다. 더 읽기 14가지 주요 기능이 이제 모든 사용자에게 제공됩니다이 중요한 Evernote 기능들은 검색, 첨부 관리, 노트 액세스 등 핵심적인 제품 성능을 높여줍니다. 이제 누구나 그 기능을 사용해 Evernote의 잠재성을 최대한 활용할 수 있습니다.
tesseract-ocrのインポート プロジェクトを作成したら早速前回作成したライブラリをインポートします。プロジェクトにインポートするのはtesseract-iOS6.1-buildディレクトリにあるdependenciesディレクトリです。プロジェクトナビゲータの適当な場所で「右クリック>Add Files to "TesseractOCRSample"...」を実行し、tesseract-iOS6.1-build/dependenciesディレクトリを選択してください。 tesseract Objective-Cラッパー「tesseract-ios」のインポート tesseract-ocrはC++で書かれているため、そのまま使うとビューコントローラなどのソースコードでObjective-CとC++が混在してしまい面倒です。 tesseract-iosはtesseract-ocrを使
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く