[B! library] extendskickのブックマーク

extendskick id:extendskick

libraryに関するextendskickのブックマーク (2)

OpenAIの音声認識Whisperがすごいので，Google Colabで試してみた - Qiita
はじめに 2022/09/22にOpenAIが音声認識モデルWhisperを発表しました．Whisperは人間レベルのロバスト性と音声認識の精度を持ったニューラルネットワークであり，オープンソース化されているので誰でも利用可能です！ [参考文献] 公式サイト：https://openai.com/blog/whisper 論文　　　：https://cdn.openai.com/papers/whisper.pdf Github　　：https://github.com/openai/whisper Whisperの概要 Whisperは68万時間分の大規模なデータセットで学習された自動音声認識モデルであり，アクセントやバックグラウンドノイズ，および専門用語に対する堅牢性が向上しています．アーキテクチャは，encoder/decoder Transf ormerとして実装されており，30秒ご
extendskick 2022/10/12
OpenAI

library
リンク
tesseractを試しに使って手書き文字（日本語）の認識精度を確認してみた。 - Qiita
はじめにオライリーのスクレイピングの本を読んでいた時、Tesseract について少し説明があった。入手可能なオープンソースOCRの中で "最良で最も正確" と書かれていたため、どのくらいの精度が出るものなのか試しに確認してみたので、その時の内容をメモとして残す。前提条件【PC環境】 Windows 10 Pro 【SW or Packageのバージョン】 tesseract　5.2.0 Python 3.9.13 pyocr　0.8.3 OpenCV　4.6.0.66 メモ内容１．Tesseract・pyocr のセットアップ。２．いくつかの画像パターンで認識精度を確認してみる。１．Tesseract・pyocr のセットアップ Tesseract のセットアップ以下のサイトより、Tesseract のインストーラーをダウンロードする。 ※インストールの際にコンポーネント
extendskick 2022/10/12
ocr

library
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx