[B! 音声] larkerのブックマーク

ウェブオーディオ API - Web API | MDN

ウェブオーディオ API はウェブ上で音声を扱うための強力で多機能なシステムを提供します。これにより開発者は音源を選択したり、エフェクトを加えたり、視覚効果を加えたり、パンニングなどの特殊効果を適用したり、他にもたくさんのいろいろなことができるようになります。ウェブオーディオ API は音声操作を音声コンテキスト内の操作として実現し、モジュラールーティングできるようにデザインされています。基本的な操作は音声ノードとして表現されています。これを接続することで、音声ルーティンググラフを作成します。チャンネル構成の異なる複数の音源も 1 つのコンテキスト内で扱えます。この構成によって、複雑で動的な音声操作を実現できるようになっています。音声ノードは、入力と出力によってチェーンと単純なウェブにリンクされています。通常、1 つまたは複数の音源から始まります。音源は、非常に小さなタイムスライス、

larker 2022/02/15

リンク

FlutterでAudio Recoder App(録音アプリ)を作成 - 人工知性を作りたい

本記事のテーマ課題解決方法ソースコード本記事のテーマ Flutter初心者向け初めてFlutterを触った際に詰まったところを共有します。 ※注：Androidでの動作確認しかしておりません課題詰まったところ１．Exampleが動かない https://pub.dev/packages/audio_recorder/example ２．マイク使用許可のpermissionsの使い方がわからない３．AndroidXに関するERRORが発生 ”The built failed likely due to AndroidX incompatibilities in a plugin.” 解決方法１．Exampleが動かない https://pub.dev/packages/audio_recorder/example "audio_recorder 1.0.2"以外のpack

larker 2021/09/11

リンク

【Flutter】音声分析をやってみた

これはFlutter #2 Advent Calendar 2020の 19 日目の記事です。この記事を読んでわかること作ろうと思ったきっかけスペクトルアナライザとは作ったものの全体像音声を取り込むときに使えるパッケージ音声のフーリエ変換 Canvas を用いたグラフ表示軸にラベルを付与する作ろうと思ったきっかけはじめまして、2021 年 1 月からエンジニアになる予定のこんぶです。わたしは大学時代に音声分析の研究をしていました。その知見をアプリ開発にも活かしたい。そこでひとまず音声分析の基礎であるスペクトルアナライザを作ってみようと思いました。実装のための調査をはじめてみると Flutter でリアルタイム音声分析をしているサンプルは少なく、同じようなことを実装したい人の役に立てるのではないかと思い、この記事を書いています。スペクトルアナライザとは先ほどス

larker 2021/09/10

リンク

MP3とOgg Vorbisの音声ファイルを無劣化で直接分割/切り取りする - 試験運用中なLinux備忘録・旧記事

MP3オーディオの分割 mp3spltというツールにより、MP3形式のオーディオデータを無劣化で分割することができる。開始位置と終了位置は「[分].[秒]」形式(例:「0.42 4.25」で0分42秒から4分25秒まで)*1で指定し、終了位置を複数指定して一気に複数個に分割することもできる。元のデータが無音部分を含む場合、-sオプションを付けることで無音部分を検出*2し、これを区切りとして自動的に分割することもできる。いずれも出力ファイル名は自動的に決められるが、-oオプションで書式を指定することもできる。 (1つの領域を切り取る) $ mp3splt -n [入力ファイル].mp3 [開始/分].[開始/秒] [終了/分].[終了/秒] (複数の領域に分割) $ mp3splt -n [入力ファイル].mp3 [開始/分].[開始/秒] [終了1/分].[終了1/秒] [終了2/分]

larker 2021/06/12

リンク

サーバルちゃんの声も聴ける!?　ヤフーの「♪検索」

sponsored AI向けのワークステーションやサーバーもズラリほかにない特徴や魅力が多数！ COMPUTEXのSilverStoneブースをチェック sponsored クラウドストレージの使いやすさ、快適さのカギを握る「同期処理のスピード」ファイルサーバーの「使い勝手」を変えずクラウドストレージへ引っ越すには？ sponsored ゲームのスクショ、プレイ動画の編集におすすめ AMD Radeon、AIバッチリ使えます：Adobe PhotoshopやPremiere Proで検証 sponsored G-Master Spear FX7をレビュー「FFXIV: 黄金のレガシー」が4Kでも遊べるゲーミングPC、「次の10年」にふさわしい仕上がり sponsored テクノロジーとデザインで“コンテンツを創造する力”を高める取り組み、ネットワークの役割 TBSのR&D拠点「Tec

larker 2017/03/24

リンク

Androidで，音声入力と音声合成をシンプルに記述するためのライブラリ案 - 主に言語とシステム開発に関して

AndroidプログラミングのTOPへ Androidアプリ開発時に，スピーチ周りのコードをシンプルに記述したい。音声入力・音声認識（ASR）音声合成・Text To Speech（TTS）これらの両者について，便利なラッパークラスとDSLを作り，コード量を削減してみる。サンプルコード下記のような記述ができる。それぞれ，処理が完了したときのタイミングでイベントを発行できる。音声入力： final Activity context = this; // 音声入力 new ASRUtil(context) .lang(Locale.US) .events(new ASRUtil.ASREventsListener(){ @Override public void beforeSpeech() { Toast.makeText(context, "お話し下さい。", Toast.L

larker 2017/03/03

リンク

Androidで録音 - teruuuのブログ

android録音アプリ開発 androidで録音できるようになったのでメモ ○権限追加 androidで録音をする場合以下2つの権限を追加する。 <uses-permission android:name="android.permission.RECORD_AUDIO"></uses-permission> <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"></uses-permission>○録音アンドロイドで録音処理を行う場合、MediaRecorderとAudioRecordの2つのクラスが用意されている。 MediaRecorder:ファイルへの書き込みが前提になっている。 AudioRecord:音声の入力情報を取得してリアルタイムの処理を行える。ファイルへの保存を行う場合は、

larker 2016/07/05

リンク

Android端末で音声合成を使ってみる | Workpiles

タイトルの通りで、アンドロイド端末で音声合成を試してみました。今回使用したのは、ドコモが公開しているWebAPIを使ってみました。このAPIのすごいところはボイスロイド製品などを開発している株式会社エーアイのライブラリを使用している点で、選択できる音声の種類も多い(11ボイス)し、合成音声のクオリティも高いと思います。加えて、Android用ライブラリも用意されていて実装も簡単という。１．準備まずは、ここからSDKをダウンロードしてきます。ダウンロードしたファイルを解凍して、libsフォルダに入っている下記ファイルをAndroidStudioプロジェクトのlibsフォルダにコピーします。・docomo-aitalk-android-sdk-1.0.1.jar ・docomo-common-android-sdk-1.0.2.jar ・jackson-annotations-2

larker 2016/02/15

リンク

統計的声質変換 (3) メルケプストラムの抽出 - 人工知能に関する断創録

統計的声質変換 (2) ボイスチェンジャーを作ろう（2015/2/25）の続き。前回は音声から抽出したメルケプストラムやピッチのパラメータを直接いじることで簡単なボイスチェンジャーを作った。今回からAさんの音声をBさんの音声に変換する規則を機械学習の手法で学習する声質変換の実験をしていきたい。今回は学習データとなる音声データをダウンロードするところとメルケプストラムを抽出するところまで。音声データのダウンロードチュートリアルと同じようにCMU ARCTIC Databasesという公開データを使う。このデータは7名の英語話者が同じ文章を朗読した音声がついている。今回作る統計的声質変換の手法は、変換元のAさんと変換先のBさんが同じ文章を読んだ音声が必要になるのでちょうどよいデータ。英語なのが残念。日本語の音声は探したけどなかった。あとで自分の声でやってみたい。一括ダウンロードするスク

larker 2015/08/20

リンク

音声認識ソフト+人力の文字起こしサービス「VoXT」

アドバンスト・メディアは7月30日、新サービス「VoXT（ボクスト）」を発表した。同社の音声認識技術「AmiVoice（アミボイス）」を利用した文字起こしサービス。「VoXT セルフ」と「VoXT フル」の2プランを用意する。 VoXT セルフは従量課金制の文字起こしサービスで、録音された音声を専用ソフトからアップロードすることで、自動的に音声を認識し、テキスト形式にしてくれるというもの。誤認識された部分は自分で編集する必要があるが、キーボードの入力に慣れた人と比べても、約2〜4倍程度の入力速度が期待できるという。料金は1分あたり32円で、ヘビーユーザー向けに月額2160円の「お得プラン」も用意する。また音声による入力にも対応する（別途「VoXT 音声入力／月額324円」の契約が必要）。 VoXT フルは完全委託型のサービスで、専用の文字起こしスタッフ（同社では「VoXTer／ボクスター

larker 2014/08/04

5年後に30億円の市場を目標らしい

リンク

Another Day: 自作ソフト紹介

larker 2014/04/14

音声データ解析ソフト

リンク

モスキート音

larker 2009/07/12

モスキート音聴覚テスト

音声

リンク

450 Free Audio Books: Download Great Books for Free | Open Culture

Download a Free Audiobook from Audible and also AudioBooks.com Download hundreds of free audio books, mostly classics, to your MP3 player or computer. Below, you’ll find great works of fiction, poetry and non-fiction , by such authors as Twain, Tolstoy, Hemingway, Orwell, Vonnegut, Nietzsche, Austen, Shakespeare, Asimov, HG Wells & more. Also please see our related collectio

larker 2009/02/24

リンク

動画から音声をMP3,AC3,WAVで抽出する「AoA Audio Extractor」 :にゅーあきばどっとこむ

AVI/DivX/XviD, MPEG, MPG, DAT, WMV, MOV, MP4, 3GPの動画（作者ページの解説より）から音声を抜き出しMP3, AC3, WAV形式で保存する「AoA Audio Extractor」がリリースされた。従来は、MPEGからの音声抽出は「VirtualDubMod」、AVIからの音声抽出は「AVI Operator」というように、動画の形式によって抽出ツールを使い分けるのが定番テクだったが、対応形式の多い「AoA Audio Extractor」ならこれ一つでOK。操作も簡単なので、ライブ動画からMP3を作成しiPod Shuffleで鑑賞……などなど、様々なスタイルで活用しよう。「AoA Audio Extractor」を作者ページからダウンロードしインストール。起動し、「Add Files」から音声抽出したい動画を選択する。ドラッグ＆ド

larker 2006/11/03

リンク

大語彙連続音声認識システムJulius

A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?

larker 2005/12/06

リンク

Passion For The Future: 声のふしぎ百科

声のふしぎ百科スポンサード　リンク・声のふしぎ百科（独）情報通信研究機構本庄情報通信研究開発支援センター長。郵政省通信総合研究所長、埼玉大学教授、日本工業大学教授を歴任。音声情報処理の第一人者が書いた音声技術の本。理系の学部生くらいが対象に思われる。「ヤマダ　タロウ」と「オオヤマ　ダイザブロウ」では、選挙で連呼されたとき、後者が聞き取りやすさで有利という音素の話。秘密は音量の差、発声のしやすさ。同じ大きさで話したつもりでも、母音の/i/と/u/は振幅が小さく、/a/と/o/は大きくなるそうである。だから大声コンテストで叫ぶと有利なのは「馬鹿ヤロー」「家事だ！」は適切とのこと。早口言葉などの研究を通じて、言葉のいいやすさも解明している。母音では/i,u/ 子音では/ch,ts,k,sh,g/が多く含まれると発声しにくく、音量も小さくなってしまうらしい。こうしたノウハウは、企業名や商

larker 2005/12/06

リンク

はてなブックマーク

タグ

関連タグで絞り込む (22)

音声に関するlarkerのブックマーク (16)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス