extendskickのブックマーク / 2022年10月12日

extendskick id:extendskick

2022年10月12日のブックマーク (3件)

cURL to Fetch
<<<< from cURL... ...to fetch >>>> clean headers copied ! copy
extendskick 2022/10/12
curl to fetch !

tools

web
リンク
OpenAIの音声認識Whisperがすごいので，Google Colabで試してみた - Qiita
はじめに 2022/09/22にOpenAIが音声認識モデルWhisperを発表しました．Whisperは人間レベルのロバスト性と音声認識の精度を持ったニューラルネットワークであり，オープンソース化されているので誰でも利用可能です！ [参考文献] 公式サイト：https://openai.com/blog/whisper 論文　　　：https://cdn.openai.com/papers/whisper.pdf Github　　：https://github.com/openai/whisper Whisperの概要 Whisperは68万時間分の大規模なデータセットで学習された自動音声認識モデルであり，アクセントやバックグラウンドノイズ，および専門用語に対する堅牢性が向上しています．アーキテクチャは，encoder/decoder Transf ormerとして実装されており，30秒ご
extendskick 2022/10/12
OpenAI

library
リンク
tesseractを試しに使って手書き文字（日本語）の認識精度を確認してみた。 - Qiita
はじめにオライリーのスクレイピングの本を読んでいた時、Tesseract について少し説明があった。入手可能なオープンソースOCRの中で "最良で最も正確" と書かれていたため、どのくらいの精度が出るものなのか試しに確認してみたので、その時の内容をメモとして残す。前提条件【PC環境】 Windows 10 Pro 【SW or Packageのバージョン】 tesseract　5.2.0 Python 3.9.13 pyocr　0.8.3 OpenCV　4.6.0.66 メモ内容１．Tesseract・pyocr のセットアップ。２．いくつかの画像パターンで認識精度を確認してみる。１．Tesseract・pyocr のセットアップ Tesseract のセットアップ以下のサイトより、Tesseract のインストーラーをダウンロードする。 ※インストールの際にコンポーネント
extendskick 2022/10/12
ocr

library
リンク
- 2022年10月21日
- 2022年10月12日
- 2022年10月5日