はじめに 本記事は、東京 Node 学園祭 2012 の LT 枠 - 6番目で発表したデモ内容の紹介になります。スライドは以下になります。(2012/11/25 20:57 貼り間違えたので修正) 構成としては、発表で紹介した Julius の Node.js アドオンから得た音声認識結果を …
2017年4月16日に引っ越しました。 コメントなどは、引越し先(右側「ブックマーク」参照)にお願いします。 オープンソースの音声認識ソフト「Julius」を、使ってみました。 いろいろなプログラムに組み込んで使用するもののようですが・・・ 「とりあえず使ってみる」ための、ディクテーションキットも配布されています。 音声ファイルからも、読み取りができます。 うまく動かせなかったところもありますが、 活用方法を工夫すれば、「テープ起こし」がラクにできそう。 ======================================== 「Juliusディクテーション実行キット」のページを開き、 「Windows版」のところをクリック。 ダウンロードしたファイルを解凍 →マイクを接続して、「run_fast.bat」を実行すれば、起動します。 1.そのまま使用 <<< please spea
SoX(Sound eXchange)で音声感知録音:その1で書いたようにSoXのデフォルトインストールではライセンスの関係でMP3関係のファイルはインストールされません。 linuxBeanのSoXでMP3を扱えるようにするのは簡単 pq@linuxBean:~$ sox -d 1.mp3 sox FAIL formats: no handler for file extension `mp3' デフォルトインストールではこういわれてmp3の録音ができません。 Synapticパッケージマネージャからlibsox-fmt-allをインストールします。 libsox-fmt-ao libsox-fmt-ffmpeg libsox-fmt-mp3 libsox-fmt-oss libsox-fmt-pulse libsox-fmt-allをインストールすると、これらがまとめてインストールされ
wavファイルの引き算(波形ではなく長さの差をとる)ができるソフトを探していたところSoX(Sound eXchange)というソフトを見つけました。調べてみるとSoXは音声ファイル関連でかなりいろいろなことができるようです。 SoX(Sound eXchange)のインストール SoX - Sound eXchange | HomePage SoXはコマンドラインツールのせいか日本語で書いているページは少ない、、、少ないですがマニュアルを日本語化されている方がいました。 SoX, SoXI, soxformat マニュアルページ日本語訳 これはすごく助かりますね。 まずはSoXのインストール。 LinuxBeanではSynapticパッケージャで検索すると14.3.2-3がでてきたのでそれをインストールしました。 SoX - Sound eXchange - Browse /sox at
SoXを使ってみたい 音声の認識や加工をターミナル上で出来るSoX(Sound eXchange)というものがあるらしい。 普段はWSL(Windows Subsystem for Linux)上でプログラムを書いているのでLinuxにインストールする手順を追っていったのだが... WSLでPCのマイクを使うことができない!!! という問題に直面した。使えるようにする方法もあるのだろうが少し調べてみても出てこないし、今回はSoXを試しに使ってみたいだけなのでWindowsのコマンドライン上で行うことにした。 しかしこのSoXというもの、実際に使えるようになるまでちょくちょく躓いたので自分用に手順をメモとして残しておく。 実行環境 Windows 10 Home 64bit SoXのインストール まずこの公式サイトに行く。 緑色のダウンロードボタンをクリックするとダウンロードが始まる。 ダウ
Try Gemini 1.5 models, our newest multimodal models in Vertex AI, and see what you can build with a 1M token context window Convert audio into text transcriptions and integrate speech recognition into applications with easy-to-use APIs. Get up to 60 minutes for transcribing and analyzing audio free per month.* New customers also get up to $300 in free credits to try Speech-to-Text and other Google
音声認識ソフト julius を試してみました。 でもって、これを electron アプリから呼び出せるようにしました。 試した環境は Mac OSX 10.13 です。 ソースはこちらです。 github.com julius のセットアップ ※後述するディクテーションキットに同梱されている julius のバイナリで実行できると思っていたのですが、私の環境ではうまくいかなかったので、別途 julius をコンパイルしてインストールする手順となっております。 (README.mdのRequirementに「MacOSX 10.11 (El Capitan)」と書いてあるため、それより上のOSバージョンの場合はコンパイルする必要があるのかもしれません) まず、julius をインストールします。 github から julius の最新版(4.4.21)をダウンロードします。 https
Juliusを使った音声認識で遊ぼうとしたら大変だった話 2014年10月19日 / kamaboko / 0 Comments 先日、卒業研究の中間発表が終わりました。 少し時間もできたので、そろそろ高専祭に向けてEject工作の準備を進めなければなりません。 ネタは既に決まっていてTwitter等を見ている方はわかると思いますが、「Ejectカー」です。(詳しくはまた別途記事を書きます。) 機構自体は既に出来上がっていて、もう後は組み立てるだけにところまでは来ています。 で、問題は「何をトリガーにして動かすか」です。 候補としては「Twitterのリプライorハッシュタグ」を考えています。 まぁ他にも色々使えそうなものがあれば使いたいなぁと色々妄想していたのですが、そこで思いついたのが「音声認識」でした。 で、とりあえず音声認識だけやってみようということで、軽い気持ちで始めたのが今回の
by Green Chameleon 誰でも気軽にAIを使える&作れるAIプラットフォーム「AIメーカー」から文字起こし機能が新たに登場しました。ムービーや音声ファイルのアップロードで文字起こししてくれるのはもちろんのこと、YouTubeのURLをコピペするだけでも内容を全自動で書きだしてくれるとのことだったので、実際に使ってみました。 「AIメーカー」で画像・音声・動画ファイル、YouTube、録音から文字起こしを行う議事録AIを作ってみた https://qiita.com/2zn01/items/97b4f6dcbbfc4119c282 みんな~!「AIメーカー」で文字起こし機能をリリースしたよー! 以下の方法で簡単に文字起こしを試せるので、ぜひ使ってみて~!! YouTubeから文字起こし 画像、音声、動画から文字起こし ️録音で文字起こし AIをうまく使って少しでも面倒な作業から
Googleがクラウドサービスとして提供している「Google Cloud Platform」の中に、「Cloud Speech-to-Text」というサービスがあります。このサービスは音声ファイルをAIが認識して文字にしてくれるというものなのですが、一体AIはどれくらい正確に文字起こししてくれるものなのか実際に使って試してみました。 Cloud Speech-to-Text - Speech Recognition | Cloud Speech-to-Text API | Google Cloud https://cloud.google.com/speech-to-text/ まず、GoogleのクラウドサービスであるGoogle Cloud Platformの登録を済ませておきます。まだ登録していないという人は以下の記事の冒頭部分を参考に登録しておいてください。 無料でGoo
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く