[B! 音声認識] led-centipedeのブックマーク

Julius カテゴリーの記事一覧 - 凹みTips

はじめに本記事は、東京 Node 学園祭 2012 の LT 枠 - 6番目で発表したデモ内容の紹介になります。スライドは以下になります。（2012/11/25 20:57 貼り間違えたので修正）構成としては、発表で紹介した Julius の Node.js アドオンから得た音声認識結果を …

led-centipede 2019/09/19

リンク

２０１７年４月１６日に引っ越しました。コメントなどは、引越し先（右側「ブックマーク」参照）にお願いします。オープンソースの音声認識ソフト「Julius」を、使ってみました。いろいろなプログラムに組み込んで使用するもののようですが・・・「とりあえず使ってみる」ための、ディクテーションキットも配布されています。音声ファイルからも、読み取りができます。うまく動かせなかったところもありますが、活用方法を工夫すれば、「テープ起こし」がラクにできそう。＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝「Juliusディクテーション実行キット」のページを開き、「Windows版」のところをクリック。ダウンロードしたファイルを解凍 →マイクを接続して、「run_fast.bat」を実行すれば、起動します。１．そのまま使用 <<< please spea

led-centipede 2019/09/18

音声認識

リンク

Juliusの認識結果をテキストファイルに書き込みたい。

led-centipede 2019/09/18

音声認識

リンク

FunnyGeek: ラズパイで電子工作

リダイレクト本サイト(FunnyGeek)は移転しました。1秒後にジャンプします。ジャンプしない場合は、以下のURLをクリックしてください。移転先のページ

led-centipede 2019/09/18

音声認識

リンク

JuliusLib - Google 検索

第12章 JuliusLib · JuliusLibの構成と仕組み · JuliusLibを用いたコンパイル · julius-simple.c 解説 · JuliusLib API (ver.xx) · Web Forum ...

led-centipede 2019/09/18

音声認識

リンク

Windowsで長時間音声ファイルからの話声抽出

led-centipede 2019/08/29

リンク

SoX（Sound eXchange)でMP3を扱う

SoX（Sound eXchange)で音声感知録音:その1で書いたようにSoXのデフォルトインストールではライセンスの関係でMP3関係のファイルはインストールされません。 linuxBeanのSoXでMP3を扱えるようにするのは簡単 pq@linuxBean:~$ sox -d 1.mp3 sox FAIL formats: no handler for file extension `mp3' デフォルトインストールではこういわれてmp3の録音ができません。 Synapticパッケージマネージャからlibsox-fmt-allをインストールします。 libsox-fmt-ao libsox-fmt-ffmpeg libsox-fmt-mp3 libsox-fmt-oss libsox-fmt-pulse libsox-fmt-allをインストールすると、これらがまとめてインストールされ

led-centipede 2019/08/29

リンク

SoX（Sound eXchange)で音声感知録音:その1

wavファイルの引き算(波形ではなく長さの差をとる）ができるソフトを探していたところSoX（Sound eXchange)というソフトを見つけました。調べてみるとSoXは音声ファイル関連でかなりいろいろなことができるようです。 SoX（Sound eXchange)のインストール SoX - Sound eXchange | HomePage SoXはコマンドラインツールのせいか日本語で書いているページは少ない、、、少ないですがマニュアルを日本語化されている方がいました。 SoX, SoXI, soxformat マニュアルページ日本語訳これはすごく助かりますね。まずはSoXのインストール。 LinuxBeanではSynapticパッケージャで検索すると14.3.2-3がでてきたのでそれをインストールしました。 SoX - Sound eXchange - Browse /sox at

led-centipede 2019/08/29

リンク

SoXをWindows10で使い始めるまでの手順(メモ) - Qiita

SoXを使ってみたい音声の認識や加工をターミナル上で出来るSoX(Sound eXchange)というものがあるらしい。普段はWSL(Windows Subsystem for Linux)上でプログラムを書いているのでLinuxにインストールする手順を追っていったのだが... WSLでPCのマイクを使うことができない！！！という問題に直面した。使えるようにする方法もあるのだろうが少し調べてみても出てこないし、今回はSoXを試しに使ってみたいだけなのでWindowsのコマンドライン上で行うことにした。しかしこのSoXというもの、実際に使えるようになるまでちょくちょく躓いたので自分用に手順をメモとして残しておく。実行環境 Windows 10 Home 64bit SoXのインストールまずこの公式サイトに行く。緑色のダウンロードボタンをクリックするとダウンロードが始まる。ダウ

led-centipede 2019/08/29

リンク

Speech API - 音声認識 | Google Cloud Platform

Try Gemini 1.5 models, our newest multimodal models in Vertex AI, and see what you can build with a 1M token context window Convert audio into text transcriptions and integrate speech recognition into applications with easy-to-use APIs. Get up to 60 minutes for transcribing and analyzing audio free per month.* New customers also get up to $300 in free credits to try Speech-to-Text and other Google

led-centipede 2019/08/28

音声認識

リンク

音声認識エンジン julius の GMM と DNN の比較と Electron からの操作方法 - I love programming and football and family

音声認識ソフト julius を試してみました。でもって、これを electron アプリから呼び出せるようにしました。試した環境は Mac OSX 10.13 です。ソースはこちらです。 github.com julius のセットアップ ※後述するディクテーションキットに同梱されている julius のバイナリで実行できると思っていたのですが、私の環境ではうまくいかなかったので、別途 julius をコンパイルしてインストールする手順となっております。 (README.mdのRequirementに「MacOSX 10.11 (El Capitan)」と書いてあるため、それより上のOSバージョンの場合はコンパイルする必要があるのかもしれません) まず、julius をインストールします。 github から julius の最新版（4.4.21）をダウンロードします。 https

led-centipede 2019/08/28

音声認識

リンク

Juliusを使った音声認識で遊ぼうとしたら大変だった話 | Life Tips（跡地）

Juliusを使った音声認識で遊ぼうとしたら大変だった話 2014年10月19日 / kamaboko / 0 Comments 先日、卒業研究の中間発表が終わりました。少し時間もできたので、そろそろ高専祭に向けてEject工作の準備を進めなければなりません。ネタは既に決まっていてTwitter等を見ている方はわかると思いますが、「Ejectカー」です。（詳しくはまた別途記事を書きます。）機構自体は既に出来上がっていて、もう後は組み立てるだけにところまでは来ています。で、問題は「何をトリガーにして動かすか」です。候補としては「Twitterのリプライorハッシュタグ」を考えています。まぁ他にも色々使えそうなものがあれば使いたいなぁと色々妄想していたのですが、そこで思いついたのが「音声認識」でした。で、とりあえず音声認識だけやってみようということで、軽い気持ちで始めたのが今回の

led-centipede 2019/08/28

音声認識

リンク

YouTubeムービーの内容を自動的に文字起こししてくれる「AIメーカー」の文字起こし機能を使ってみました

by Green Chameleon 誰でも気軽にAIを使える＆作れるAIプラットフォーム「AIメーカー」から文字起こし機能が新たに登場しました。ムービーや音声ファイルのアップロードで文字起こししてくれるのはもちろんのこと、YouTubeのURLをコピペするだけでも内容を全自動で書きだしてくれるとのことだったので、実際に使ってみました。「AIメーカー」で画像・音声・動画ファイル、YouTube、録音から文字起こしを行う議事録AIを作ってみた https://qiita.com/2zn01/it ems/97b4f6dcbbfc4119c282 みんな～！「AIメーカー」で文字起こし機能をリリースしたよー！以下の方法で簡単に文字起こしを試せるので、ぜひ使ってみて～！！ YouTubeから文字起こし画像、音声、動画から文字起こし ️録音で文字起こし AIをうまく使って少しでも面倒な作業から

led-centipede 2019/08/28

音声認識

リンク

Googleの音声認識エンジンを使って音声ファイルから文字起こししてみた

Googleがクラウドサービスとして提供している「Google Cloud Platform」の中に、「Cloud Speech-to-Text」というサービスがあります。このサービスは音声ファイルをAIが認識して文字にしてくれるというものなのですが、一体AIはどれくらい正確に文字起こししてくれるものなのか実際に使って試してみました。 Cloud Speech-to-Text - Speech Recognition | Cloud Speech-to-Text API | Google Cloud https://cloud.google.com/speech-to-text/ まず、GoogleのクラウドサービスであるGoogle Cloud Platformの登録を済ませておきます。まだ登録していないという人は以下の記事の冒頭部分を参考に登録しておいてください。無料でGoo