<<<< from cURL... ...to fetch >>>> clean headers copied ! copy
はじめに 2022/09/22にOpenAIが音声認識モデルWhisperを発表しました.Whisperは人間レベルのロバスト性と音声認識の精度を持ったニューラルネットワークであり,オープンソース化されているので誰でも利用可能です! [参考文献] 公式サイト:https://openai.com/blog/whisper 論文 :https://cdn.openai.com/papers/whisper.pdf Github :https://github.com/openai/whisper Whisperの概要 Whisperは68万時間分の大規模なデータセットで学習された自動音声認識モデルであり,アクセントやバックグラウンドノイズ,および専門用語に対する堅牢性が向上しています.アーキテクチャは,encoder/decoder Transformerとして実装されており,30秒ご
はじめに オライリーのスクレイピングの本を読んでいた時、Tesseract について少し説明があった。 入手可能なオープンソースOCRの中で "最良で最も正確" と書かれていたため、どのくらいの精度が出るものなのか試しに確認してみたので、その時の内容をメモとして残す。 前提条件 【PC環境】 Windows 10 Pro 【SW or Packageのバージョン】 tesseract 5.2.0 Python 3.9.13 pyocr 0.8.3 OpenCV 4.6.0.66 メモ内容 1.Tesseract・pyocr のセットアップ。 2.いくつかの画像パターンで認識精度を確認してみる。 1.Tesseract・pyocr のセットアップ Tesseract のセットアップ 以下のサイトより、Tesseract のインストーラーをダウンロードする。 ※インストールの際にコンポーネント
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く