タグ

音声に関するlarkerのブックマーク (16)

  • ウェブオーディオ API - Web API | MDN

    ウェブオーディオ API はウェブ上で音声を扱うための強力で多機能なシステムを提供します。これにより開発者は音源を選択したり、エフェクトを加えたり、視覚効果を加えたり、パンニングなどの特殊効果を適用したり、他にもたくさんのいろいろなことができるようになります。 ウェブオーディオ API は音声操作を音声コンテキスト内の操作として実現し、モジュラールーティングできるようにデザインされています。基的な操作は 音声ノードとして表現されています。これを接続することで、音声ルーティンググラフを作成します。チャンネル構成の異なる複数の音源も 1 つのコンテキスト内で扱えます。この構成によって、複雑で動的な音声操作を実現できるようになっています。 音声ノードは、入力と出力によってチェーンと単純なウェブにリンクされています。通常、1 つまたは複数の音源から始まります。音源は、非常に小さなタイムスライス、

    ウェブオーディオ API - Web API | MDN
  • FlutterでAudio Recoder App(録音アプリ)を作成 - 人工知性を作りたい

    記事のテーマ 課題 解決方法 ソースコード 記事のテーマ Flutter初心者向け 初めてFlutterを触った際に詰まったところを共有します。 ※注:Androidでの動作確認しかしておりません 課題 詰まったところ 1.Exampleが動かない https://pub.dev/packages/audio_recorder/example 2.マイク使用許可のpermissionsの使い方がわからない 3.AndroidXに関するERRORが発生 ”The built failed likely due to AndroidX incompatibilities in a plugin.” 解決方法 1.Exampleが動かない https://pub.dev/packages/audio_recorder/example "audio_recorder 1.0.2"以外のpack

    FlutterでAudio Recoder App(録音アプリ)を作成 - 人工知性を作りたい
  • 【Flutter】音声分析をやってみた

    これはFlutter #2 Advent Calendar 2020の 19 日目の記事です。 この記事を読んでわかること 作ろうと思ったきっかけ スペクトルアナライザとは 作ったものの全体像 音声を取り込むときに使えるパッケージ 音声のフーリエ変換 Canvas を用いたグラフ表示 軸にラベルを付与する 作ろうと思ったきっかけ はじめまして、2021 年 1 月 からエンジニアになる予定のこんぶです。 わたしは大学時代に音声分析の研究をしていました。 その知見をアプリ開発にも活かしたい。 そこでひとまず音声分析の基礎であるスペクトルアナライザを作ってみようと思いました。 実装のための調査をはじめてみると Flutter でリアルタイム音声分析をしているサンプルは少なく、同じようなことを実装したい人の役に立てるのではないかと思い、この記事を書いています。 スペクトルアナライザとは 先ほどス

    【Flutter】音声分析をやってみた
  • MP3とOgg Vorbisの音声ファイルを無劣化で直接分割/切り取りする - 試験運用中なLinux備忘録・旧記事

    MP3オーディオの分割 mp3spltというツールにより、MP3形式のオーディオデータを無劣化で分割することができる。 開始位置と終了位置は「[分].[秒]」形式(例:「0.42 4.25」で0分42秒から4分25秒まで)*1で指定し、終了位置を複数指定して一気に複数個に分割することもできる。 元のデータが無音部分を含む場合、-sオプションを付けることで無音部分を検出*2し、これを区切りとして自動的に分割することもできる。いずれも出力ファイル名は自動的に決められるが、-oオプションで書式を指定することもできる。 (1つの領域を切り取る) $ mp3splt -n [入力ファイル].mp3 [開始/分].[開始/秒] [終了/分].[終了/秒] (複数の領域に分割) $ mp3splt -n [入力ファイル].mp3 [開始/分].[開始/秒] [終了1/分].[終了1/秒] [終了2/分]

    MP3とOgg Vorbisの音声ファイルを無劣化で直接分割/切り取りする - 試験運用中なLinux備忘録・旧記事
  • サーバルちゃんの声も聴ける!? ヤフーの「♪検索」

    sponsored AI向けのワークステーションやサーバーもズラリ ほかにない特徴や魅力が多数! COMPUTEXのSilverStoneブースをチェック sponsored クラウドストレージの使いやすさ、快適さのカギを握る「同期処理のスピード」 ファイルサーバーの「使い勝手」を変えずクラウドストレージへ引っ越すには? sponsored ゲームのスクショ、プレイ動画の編集におすすめ AMD Radeon、AIバッチリ使えます:Adobe PhotoshopやPremiere Proで検証 sponsored G-Master Spear FX7をレビュー 「FFXIV: 黄金のレガシー」が4Kでも遊べるゲーミングPC、「次の10年」にふさわしい仕上がり sponsored テクノロジーとデザインで“コンテンツを創造する力”を高める取り組み、ネットワークの役割 TBSのR&D拠点「Tec

    サーバルちゃんの声も聴ける!? ヤフーの「♪検索」
  • Androidで,音声入力と音声合成をシンプルに記述するためのライブラリ案 - 主に言語とシステム開発に関して

    AndroidプログラミングのTOPAndroidアプリ開発時に,スピーチ周りのコードをシンプルに記述したい。 音声入力・音声認識(ASR) 音声合成Text To Speech(TTS) これらの両者について,便利なラッパークラスとDSLを作り,コード量を削減してみる。 サンプルコード 下記のような記述ができる。 それぞれ,処理が完了したときのタイミングでイベントを発行できる。 音声入力: final Activity context = this; // 音声入力 new ASRUtil(context) .lang(Locale.US) .events(new ASRUtil.ASREventsListener(){ @Override public void beforeSpeech() { Toast.makeText(context, "お話し下さい。", Toast.L

    Androidで,音声入力と音声合成をシンプルに記述するためのライブラリ案 - 主に言語とシステム開発に関して
  • Androidで録音 - teruuuのブログ

    android録音アプリ開発 androidで録音できるようになったのでメモ ○権限追加 androidで録音をする場合以下2つの権限を追加する。 <uses-permission android:name="android.permission.RECORD_AUDIO"></uses-permission> <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"></uses-permission>○録音 アンドロイドで録音処理を行う場合、MediaRecorderとAudioRecordの2つのクラスが用意されている。 MediaRecorder:ファイルへの書き込みが前提になっている。 AudioRecord:音声の入力情報を取得してリアルタイムの処理を行える。ファイルへの保存を行う場合は、

    Androidで録音 - teruuuのブログ
  • Android端末で音声合成を使ってみる | Workpiles

    タイトルの通りで、アンドロイド端末で音声合成を試してみました。 今回使用したのは、ドコモが公開しているWebAPIを使ってみました。 このAPIのすごいところはボイスロイド製品などを開発している株式会社エーアイのライブラリを使用している点で、選択できる音声の種類も多い(11ボイス)し、合成音声のクオリティも高いと思います。 加えて、Android用ライブラリも用意されていて実装も簡単という。 1.準備 まずは、ここからSDKをダウンロードしてきます。 ダウンロードしたファイルを解凍して、libsフォルダに入っている下記ファイルをAndroidStudioプロジェクトのlibsフォルダにコピーします。 ・docomo-aitalk-android-sdk-1.0.1.jar ・docomo-common-android-sdk-1.0.2.jar ・jackson-annotations-2

  • 統計的声質変換 (3) メルケプストラムの抽出 - 人工知能に関する断創録

    統計的声質変換 (2) ボイスチェンジャーを作ろう(2015/2/25)の続き。 前回は音声から抽出したメルケプストラムやピッチのパラメータを直接いじることで簡単なボイスチェンジャーを作った。今回からAさんの音声をBさんの音声に変換する規則を機械学習の手法で学習する声質変換の実験をしていきたい。今回は学習データとなる音声データをダウンロードするところとメルケプストラムを抽出するところまで。 音声データのダウンロード チュートリアルと同じようにCMU ARCTIC Databasesという公開データを使う。このデータは7名の英語話者が同じ文章を朗読した音声がついている。今回作る統計的声質変換の手法は、変換元のAさんと変換先のBさんが同じ文章を読んだ音声が必要になるのでちょうどよいデータ。英語なのが残念。日語の音声は探したけどなかった。あとで自分の声でやってみたい。 一括ダウンロードするスク

    統計的声質変換 (3) メルケプストラムの抽出 - 人工知能に関する断創録
  • 音声認識ソフト+人力の文字起こしサービス「VoXT」

    アドバンスト・メディアは7月30日、新サービス「VoXT(ボクスト)」を発表した。同社の音声認識技術「AmiVoice(アミボイス)」を利用した文字起こしサービス。「VoXT セルフ」と「VoXT フル」の2プランを用意する。 VoXT セルフは従量課金制の文字起こしサービスで、録音された音声を専用ソフトからアップロードすることで、自動的に音声を認識し、テキスト形式にしてくれるというもの。 誤認識された部分は自分で編集する必要があるが、キーボードの入力に慣れた人と比べても、約2〜4倍程度の入力速度が期待できるという。料金は1分あたり32円で、ヘビーユーザー向けに月額2160円の「お得プラン」も用意する。また音声による入力にも対応する(別途「VoXT 音声入力/月額324円」の契約が必要)。 VoXT フルは完全委託型のサービスで、専用の文字起こしスタッフ(同社では「VoXTer/ボクスター

    音声認識ソフト+人力の文字起こしサービス「VoXT」
    larker
    larker 2014/08/04
    5年後に30億円の市場を目標らしい
  • Another Day: 自作ソフト紹介

    larker
    larker 2014/04/14
    音声データ解析ソフト
  • モスキート音

    larker
    larker 2009/07/12
    モスキート音聴覚テスト
  • 450 Free Audio Books: Download Great Books for Free | Open Culture

    Down­load a Free Audio­book from Audi­ble and also AudioBooks.com Down­load hun­dreds of free audio books, most­ly clas­sics, to your MP3 play­er or com­put­er. Below, you’ll find great works of fic­tion, poet­ry and non-fic­tion , by such authors as Twain, Tol­stoy, Hem­ing­way, Orwell, Von­negut, Niet­zsche, Austen, Shake­speare, Asi­mov, HG Wells & more. Also please see our relat­ed col­lec­tio

    450 Free Audio Books: Download Great Books for Free | Open Culture
  • 動画から音声をMP3,AC3,WAVで抽出する「AoA Audio Extractor」 :にゅーあきばどっとこむ

    AVI/DivX/XviD, MPEG, MPG, DAT, WMV, MOV, MP4, 3GPの動画(作者ページの解説より)から音声を抜き出しMP3, AC3, WAV形式で保存する「AoA Audio Extractor」がリリースされた。従来は、MPEGからの音声抽出は「VirtualDubMod」、AVIからの音声抽出は「AVI Operator」というように、動画の形式によって抽出ツールを使い分けるのが定番テクだったが、対応形式の多い「AoA Audio Extractor」ならこれ一つでOK。操作も簡単なので、ライブ動画からMP3を作成しiPod Shuffleで鑑賞……などなど、様々なスタイルで活用しよう。 「AoA Audio Extractor」を作者ページからダウンロードしインストール。 起動し、「Add Files」から音声抽出したい動画を選択する。ドラッグ&ド

  • 大語彙連続音声認識システムJulius

    A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?

    大語彙連続音声認識システムJulius
  • Passion For The Future: 声のふしぎ百科

    声のふしぎ百科 スポンサード リンク ・声のふしぎ百科 (独)情報通信研究機構庄情報通信研究開発支援センター長。郵政省通信総合研究所長、埼玉大学教授、日工業大学教授を歴任。音声情報処理の第一人者が書いた音声技術。理系の学部生くらいが対象に思われる。 「ヤマダ タロウ」と「オオヤマ ダイザブロウ」では、選挙で連呼されたとき、後者が聞き取りやすさで有利という音素の話。秘密は音量の差、発声のしやすさ。同じ大きさで話したつもりでも、母音の/i/と/u/は振幅が小さく、/a/と/o/は大きくなるそうである。だから大声コンテストで叫ぶと有利なのは「馬鹿ヤロー」「家事だ!」は適切とのこと。 早口言葉などの研究を通じて、言葉のいいやすさも解明している。母音では/i,u/ 子音では/ch,ts,k,sh,g/が多く含まれると発声しにくく、音量も小さくなってしまうらしい。こうしたノウハウは、企業名や商

  • 1