[B! voice] kyo_agoのブックマーク

kyo_ago id:kyo_ago

voiceに関するkyo_agoのブックマーク (16)

Talon
Talon enables you to write code, play games, and control your computer with voice, eye tracking, or noises.
kyo_ago 2024/02/19
code

python

software

ソフトウェア

voice
リンク
superwhisper
Write 3x faster, without lifting a finger.superwhisper AI powered voice to text for macOS
kyo_ago 2024/02/19
class

software

mac

ツール

AI

audio

tool

ソフトウェア

音声

voice
リンク
VOICEPEAK 商用可能 6ナレーターセット
『VOICEPEAK』は、最新のAI 音声合成技術を搭載し手軽に読み上げさせることが可能な入力文字読み上げソフトです。お好みの文章や言葉をテキストで入力するだけで、簡単に高品質な音声が作成できます。感情パラメータによる喜怒哀楽の表現にも対応しています。「VOICEPEAK 商用可能 6ナレーターセット」には6人のナレーター(男性3名、女性3名)に加えて幼い「女の子」の声も収録されており、様々な声のバリエーションで読み上げが行えます。個人ユーザー様のご利用はもちろん、教育機関の方や法人様など、様々な商用・業務用途でのご利用も可能です。 OSはWindows、macOS、Linuxに対応。体験版もご用意しておりますので、ぜひお試しください。・女性1 声優：若守みづき特徴：息づかいが感じられる、やや高めでやわらかく優しい声色です。・女性2 声優：野宮佳乃特徴：落ち着いたトーンの声
kyo_ago 2023/02/27
software

AI

読み上げ

voice

VOCALOID

tool

webサービス

ソフトウェア

音声合成

音声読み上げ
リンク
Catchbox – World’s First Throwable Microphone
Capture crisp audio Mic up everyone in large spaces ensuring crisp audio capture for hybrid setups, voice lift, and captioning. Hear everyone, anywhere Professional audio, exceptional user experience Poor audio and user experience can make or break the success of a meeting, lecture, or event. Capture crisp audio from both the presenter and the audience with the intuitive Catchbox Plus wireless mic
kyo_ago 2019/09/10
gadget

facilitation

voice

ガジェット

neta
リンク
Mute Background Noise | Noise Cancelling Software | krisp
Your AI-powered assistant for meetings and calls Krisp maximizes the productivity of online meetings with its AI-powered Noise Cancellation, Transcriptions, Meeting Notes and Recording.
kyo_ago 2018/11/20
voice

software

macOS

noise

mac

NVIDIA

ディープラーニング
リンク
Text to Speech App Voicepaper
- Change Voice Speed - Highlight Speaking Position - Start Speaking from Selected Position - Remote Control in the Lock Screen - Sleep Timer - Repeat Current Text - Auto Language Detect from Text We treat your data seriously. Privacy Your text data is not accessed or analyzed for any purpose. The text data you save in Voicepaper is saved only to your device. Your text data history is not shared. Y
kyo_ago 2018/09/09
iphone

iPad

voice
リンク
ブラウザ上でそのまま使える、ボイスチェンジャー無料公開
ブラウザ上でそのまま使える、ボイスチェンジャー無料公開株式会社ユーザーローカルは、Webブラウザから声のトーンを変更できるボイスチェンジャー「ユーザーローカルボイスチェンジャー」を無料公開しました。ダウンロード不要で、PCやスマートフォンからも利用可能となっています。発声者本人とは異なる性別や、バーチャルYouTuber（VTuber）として活動する際に違うトーンの音声にするなどにも使用できます。「ユーザーローカルボイスチェンジャー」では、マイク入力が可能な端末であれば、Webブラウザから手軽に利用できることが特徴です。ボイスチェンジャーは、専用のソフトウェアのインストールやデバイスが必要となることも多いですが、「ユーザーローカルボイスチェンジャー」は無料で利用でき、またブラウザから開くだけで使用できます。使用方法はWebサイトにアクセスし、「録音」ボタンを押して声を吹き込んだ
kyo_ago 2018/08/30
ブラウザ

VR

AR

変換

voice

audio
リンク
Text-to-Speech AI: Lifelike Speech Synthesis | Google Cloud
Convert text into natural-sounding speech using an API powered by the best of Google’s AI techno logies. New customers get up to $300 in free credits to try Text-to-Speech and other Google Cloud products.
kyo_ago 2018/07/19
platform-as-a-service

cloud

voice

google

音声

機械学習

api

音声合成

deepmind
リンク
キズナアイとねこますの声を入れ替える機械学習をした - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 最近バーチャルユーチュ－バーが人気ですよね。自分もこの流れに乗って何か作りたいと思い、開発をしました。モーションキャプチャー等を使って見た目を変えるのはかなり普及しているっぽいので、自分は声を変えられるようにしようと開発しました。やったことキズナアイさんとねこますさんの、それぞれの声を入れ替えられるようにしました。これによって、ねこますさんのしゃべった内容を、キズナアイさんの声でしゃべらせることができます。(逆も) 機械学習手法の一つであるCycleGANを用いて、変換するためのネットワークを学習しました。パラレルデータ(話者
kyo_ago 2018/05/16
学習

VTuber(バーチャルYoutuber)

qiita

データ

機械学習

要経過観察

キャラクター

voice

programming
リンク
自分の声の“分身”を作れるアプリ「コエステーション」登場　まずはiPhone版から
東芝デジタルソリューションズは4月17日、自分の声をもとにして生成したデータを使って音声合成できるiPhone（iOS）アプリ「コエステーション」の提供を開始した。同社のコミュニケーションAI「RECAIUS（リカイアス）」の音声合成技術を活用したもので、作成したデータを生かした新アプリ・サービスの展開も視野に入れている。現時点ではAndroid版は用意されていない。コエステーションでは、自分の音声を元に作成したデータを「コエ」と呼んでいる。コエを作成するには、最低でも10個の文章を読み上げる必要がある。読み上げ時は、静寂な場所でイヤフォンマイクの利用が推奨されている。コエ作成にかかる最低所要時間は20～25分程度（読み上げに5分程度、コエ生成に15～25分）を見込んでいる。データは多ければ多いほどコエの精度が向上する。
kyo_ago 2018/04/18
アプリ

iPhoneアプリ

ios

iphone

mobile

AI

データ

コミュニケーション

voice
リンク
Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog
はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかというと discord でちょっと仕事で使ってみたくてボイスチャットチャンネルに没頭*1参加させて録音させてそのデータを google のドキュメントとして音声で食わせて文字起こしさせればあの会議とかねリモートワークとかですごい便利なんじゃないかなと思って文字認識 api ってちょっと公開されてるかわかんないんだけどこういう api って google あんまりね有料 api 脱退後悔*2しきれなかったりっていうイメージあるんだよねまあ google ドキュメントを使わせるためのインセンティブやっ
kyo_ago 2017/09/04
api

document

google

bot

音声

文字起こし

音声認識

Mizchi

voice
リンク
Hushme Inc
Got Noisy Coworkers? Hushme speech privacy mask will block out the outside noise and protect your private conversation.
kyo_ago 2017/03/22
gadget

Device

neta

voice
リンク
TechCrunch | Startup and Technology News
William A. Anders, the astronaut behind perhaps the single most iconic photo of our planet, has died at the age of 90. On Friday morning, Anders was piloting a small…
kyo_ago 2016/10/19
neuro

msr

voice

cortana

機械学習

microsoft

音声認識

マイクロソフト

ニューラルネットワー

アクセント
リンク
Bing Voice Recognition (Beta) | Microsoft Azure Marketplace
BING VOICE RECOGNITION API BETA ONLINE SERVICE AGREEMENT Dated: Updated April 2015 Section 1 Description of Services The Bing Voice Recognition API is an https application programming interface (the "API") that takes an audio stream as input and turns it into a text (the “Service”). Software applications, websites or other devices or services developed may utilize the API to interact with the Serv
kyo_ago 2016/03/24
bing

api

Azure

Application

beta

Microsoft

サービス

実装

speech

VOICE
リンク
VoiceText Web APIを使ってTwitterのhome_timelineを読み上げる | DevelopersIO
はじめに今日のお題は、夏休みの自由研究的なものです。昨日、VoiceText Web API (β版)というサービスが公開されました。こちらはHOYAサービス株式会社様の音声合成ソフトウェア「VoiceText」を、Web API経由で使えるというものになります。こちらが良く出来ていて、読み上げの精度も高いし、元となる声や感情を複数種類から選べるし、声のピッチやスピードも変えられるし、なかなか面白いです。このサービスを使ってちょっと遊んでみようと思い、Twitterの自分のホームタイムラインを読み上げさせるスクリプトを書いてみました。材料 Ruby (2.0.0p353) The Twitter Ruby Gem VoiceText Web API VoiceTextApi (ex. VoiceText Web APIで遊ぶ - ただのにっき(2014-07-09)) SoX...
kyo_ago 2014/07/14
key

api

oauth

config

ruby

twitter

音声合成

Web API

voice
リンク
CSSの声を聞く - 思ったこと
CSS Property Advent Calendar 2013 の15日目です！今回は、現在 Technical Report 段階の CSS-Speech Module を紹介します！ CSS-Speech Moduleってなに？ CSS （ Cascading Style Sheets ）は、（ HTML や XML などの）マークアップ文書から，スクリーン, 紙, 発話（ speech ）, 等々の媒体への具現化（ rendering ）を記述するための言語である。 Speech モジュールは、作者が，発話合成を通して, 加えて随意で音声指示も利用して，文書の音声化（ rendering ）を宣言的に制御できるようにするための、聴覚 CSS プロパティを定義する。この標準は Voice Browser Activity との協同の下，開発された。扱いとしては、med
kyo_ago 2013/12/16
css

audio

Advent Calendar

speech

css-speech

accessibility

voice

cv

CSS Property

AdventCalendar2013
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx