前提 whisper.cppのGPU対応の兆しが前々からあったのですが、昨日ついにmainブランチにマージされたみたいなので早速試してみます。 また、環境は以下です。 Ubuntu 22.04 RTX3060(12GB) DockerにてGPU利用環境構築済み whisper.cppのセットアップ
OpenAI の Whisper を使って授業動画に正しいキャプションを付けたい † Microsoft Stream の標準機能で自動的に動画にキャプションを付けられるのだけれど、 文字起こしの精度が悪すぎてとても残念な感じになってます。。。 OpenAI の Whisper を使うとより正確な文字起こしができそうなので、試してみることにします。 → gigazin の記事: https://gigazine.net/news/20220929-openai-whisper-install-and-usage/ Docker を使って簡単に動かせるようです † 普段から pip を使って python で計算をしているなら docker を使うまでもないですが、 テストでちょこっとやってみたいなら docker でいろいろ気にせずやっちゃうのが便利? https://dev.classm
PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイムで文字起こしするツールを作成した。 ループバック録音 SoundCardを使うと、PCで再生されている音声を録音することができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く