[B! voice] masterqのブックマーク

masterq id:masterq

voiceに関するmasterqのブックマーク (55)

GitHub - pzmarzly/mic_over_mumble: Use Android/iOS device as your PC's remote microphone, using Mumble + Plumble. Or use microphone of one PC on other PC. Linux-only script
masterq 2026/01/16
android

ios

iphone

mic

voice

linux
リンク
Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか？
声に革命を。Aivisアイビス Projectプロジェクトが切り拓く、感動の音声体験。 Aivis Project は、感情豊かな音声合成技術を誰もがかんたんに活用できる未来を目指す、壮大な開発プロジェクトです。機械的な響きに留まらない、まるで魂を宿したかのような音声が、あなたの想いや言葉に豊かな感情をのせて世界へと響き渡る。Aivis Project が描く未来は、これまでにない感動と驚きに満ちています。解説動画に聞き取りやすい良質な音声を添え、好きなキャラとボイスチャットで会話を楽しむ。社内向けの研修動画やプレゼン資料に、説得力のあるナレーションを加えて伝達力を高める。そうした多様な表現が、私たちのプロダクトを通じて数クリックで実現します。 AivisSpeech でのローカル音声合成から、音声合成モデルの制作・公開、高速なクラウド API まで。 Aivis Proje
masterq 2024/12/04
ai

voice

speech

osx

mac

windows
リンク
Illuminate | Learn Your Way
Transf orm research papers into AI-generated audio summaries with Illuminate, your Gen AI tool for understanding complex content faster.
masterq 2024/10/03
paper

ai

summary

audio

voice
リンク
創作中に音楽を聴くことでインスピレーションを得るには何に注目すべきなのか？
作業中や勉強中などに、集中力を上げるために音楽を聴く人もいれば、音楽を聴きながらだと気が散ってしまうという人もいます。過去の研究では、音楽の種類や個人の性格が重要だという研究結果や、音楽を聴くと創造力が損なわれるという研究結果もあります。美術学の修士号を持つ作家のリズ・リッグス氏は、「音楽を聴くことで小説家はインスピレーションを得ることができる」とした上で、どのような聴き方が適しているか語っています。 Setting the Tone: How Listening to Music Can Inspire Fiction Writers ‹ Literary Hub https://lithub.com/setting-the-tone-how-listening-to-music-can-inspire-fiction-writers/ 音楽が人間の生産性に作用することについては、何年も
masterq 2024/07/22
"歌詞がない方が集中できると思ってインストゥルメンタルの音楽を聴いていたものの、数年前から、執筆中にあえて歌詞付きの音楽を聴くようになった" そうなんだよなー

music

sound

bgm

voice

work
リンク
Metaが低ビットレートで良音質の音声コーデック「MLow」を発表、スマホの通話アプリ向けに開発
WhatsAppやMessengerなどのリアルタイムコミュニケーション(RTC)アプリを開発するMetaが、RTC向けの低ビットレートでありながら高い音質を目指したオーディオコーデック「MLow(Meta Low Bitrate)」を発表しました。 MLow: Meta's low bitrate audio codec - Engineering at Meta https://engineering.fb.com/2024/06/13/web/mlow-metas-low-bitrate-audio-codec/ スマートフォンのRTCアプリで音声通話を行う場合、重要なのがコーデックです。一般的な通話でキャプチャされる音声のビットレートは、モノラル・サンプリングレート48kHz・ビット深度16ビットだとおよそ768kbpsになります。しかし、スマートフォンで快適に通話をするためには、
masterq 2024/06/14
"MLowはOpusよりも音声品質が2倍優れていながら、計算コストがOpusよりも10％低いのが特徴"

meta

phone

voice

sound

codec

rtc
リンク
重音テト（かさねてと）オフィシャルサイト
重音テトとは、有志がインターネット上で意見や素材を出し合って制作されたキャラクターです。歌声として利用できる音声素材集を持ち、実際に歌うことができます。
masterq 2024/04/05
voice

music

vocaloid
リンク
Voidol3R ｜変幻自在の声質変換
※Microsoft社の2025年10月14日のWindows10サポート終了に合わせ、Voidol製品のWindows10サポートも終了いたします。変幻自在の声質変換を実現したVoidol3が新AI声質変換方式「RVC」を搭載してさらに進化 AIモードとSYNTHモードの連結や瞬時のプリセット切り替えにより変幻自在の声質変換を実現したVoidol3が、新しいAI声質変換方式に対応することで、より高精度かつ自然な声質変換を可能としました。さらなる進化で新たなステージへと進んだVoidol3Rを、ぜひご体験ください。 ※Voidol3R本体およびVoidol RVCのご使用にはPCスペック等の条件があります。注意事項を必ずご確認の上、ご購入ください。 ※上記のストア販売サイトからVoidol3をご購入いただくと、無償アップデートにてVoidol3Rをご利用いただけます。 Voido
masterq 2024/03/20
voice

ai

vtuber

windows

osx

free
リンク
LiteRT for Microcontrollers | Google AI Edge | Google AI for Developers
LiteRT for Microcontrollers is designed to run machine learning models on microcontrollers and other devices with only a few kilobytes of memory. The core runtime just fits in 16 KB on an Arm Cortex M3 and can run many basic models. It doesn't require operating system support, any standard C or C++ libraries, or dynamic memory allocation. Why microcontrollers are important Microcontrollers are typ
masterq 2024/03/14
"Captures audio with a microphone to detect the words "yes" and "no""

mcu

embedded

tensorflow

ai

arm

esp32

audio

sound

voice

speech
リンク
GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
masterq 2024/03/14
ai

speech

voice

pytorch
リンク
GitHub - noisetorch/NoiseTorch: Real-time microphone noise suppression on Linux.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
masterq 2023/11/22
今だとこれが良さそう

linux

voice

pulseaudio

noise

sound

audio

meeting

mic
リンク
AI英会話アプリ ELSA Speak
Googleが出資した最先端のAI 英会話アプリです！英会話に特化したAI機能で、月2316円の低価格使い放題を実現。 AI 英会話 / AI発音矯正 / AIスピーチ分析これら3つの機能で、いつでも、どこでも、何度でも、1人で実践でつかえる英会話の練習ができてしまいます！ 3週間で変化が実感できたとの声も続出！ ELSA Speakは、ゲームのように楽しみながらネイティブに伝わる発音に近づける「発音矯正機能」があります。この機能を使えばアプリが自分発音を採点し、改善案を提案してくれるのでいつでも、どこでも、何度でも 1人で練習できます。そして、自分が発する音は鮮明に聞き取れるようになるため、海外ドラマの英語なども鮮明に聞こえるようになり、成長がとても実感しやすいアプリになっております。
masterq 2023/02/05
english

learning

talk

sound

voice

education

ios

iphone

android
リンク
GitHub - ggml-org/whisper.cpp: Port of OpenAI's Whisper model in C/C++
Stable: v1.7.6 / Roadmap High-performance inference of OpenAI's Whisper automatic speech recognition (ASR) model: Plain C/C++ implementation without dependencies Apple Silicon first-class citizen - optimized via ARM NEON, Accelerate framework, Metal and Core ML AVX intrinsics support for x86 architectures VSX intrinsics support for POWER architectures Mixed F16 / F32 precision Integer quantization
masterq 2022/11/22
SIMDでも頑張ればGPGPU並のパフォーマンスが出るということ？ggml.cとwhisper.cppを読んでみること

c

c++

speech

recognition

avx

simd

voice

ai

あとで読む
リンク
AI 音声ジェネレーターと音声合成ツール — Amazon Polly — AWS
Amazon Polly は、オンデマンドで音声を生成し、あらゆるテキストを音声ストリームに変換する、フルマネージドサービスです。深層学習テクノロジーを使用して、記事、ウェブページ、PDF ドキュメント、他のテキスト読み上げ (TTS) の変換を行います。Polly は、エンゲージメントとコンバージョンを実現する音声起動アプリケーションを構築できるように、幅広い言語で数十種類のリアルな音声を提供します。さまざまな地域や市場のユーザーの多様な言語、アクセシビリティ、学習ニーズに対応します。強力なニューラルネットワークと生成音声エンジンがバックグラウンドで機能し、音声を合成します。Amazon Polly API を既存のアプリケーションに統合して、すぐに音声対応にします。
masterq 2022/08/25
aws

amazon

ai

language

voice

text
リンク
青空朗読 | 青空文庫に所蔵されている本を朗読しています
本サイトはスクリーンリーダーに対応するようにページを改編しました。これからも目の不自由な方が音声読み上げソフトを使い朗読を楽しんでいただけるように改善していきます。朗読がどなたにも心休まる豊かな時間になることを願って。まだ、不十分な点があると思います。使いづらいところがありましたらこちらまでお知らせください
masterq 2022/01/03
book

free

voice

doc

japanese

audio
リンク
ソフトウェアが世界を飲み込んでいると言った男
Pull Requestより。マーク・アンドリーセンが、ビルド、COVID、そしてインターネットが如何にして私たちを以前の思考形態に戻しているかについて語るアントニオ・ガルシア・マルティネス Katia Sobolskiによる肖像画私の年齢が幾つなのか、言わずに教えてあげよう。私がワールド・ワイド・ウェブを初めて見たのは、パンプローナのナバラ大学で、Netscape 3.xを実行し、「throbber」と呼ばれるものを見ていた時でした。これは、惑星にまたがる「N」が流星群に襲われる様子をピクセル単位にループさせたアニメーションで、ページが読み込まれるまでに1分以上掛かっていました。当時のダサいアプリケーションが創り出した世界で、いつか自分が生計を立てることになるとは、また、その発明家であり設計者の1人とのインタビューについて書くことになるとは、漠然とでも考えたことはありませんでした。
masterq 2021/07/18
"280文字のツイートでTwitterの激しい争いをするのと、実際に学び...2時間かけてテーマを詳細に説明するClubhouseを聴くのと、どちらがいいですか?"

sns

twitter

clubhouse

voice

chat

society

doc

japanese

interview
リンク
Microsoft Translator Speech API 自動翻訳 | Microsoft Azure
masterq 2021/06/14
これはすごい。僕が朗読するより自然なのではないか。

microsoft

speech

azure

text

language

japanese

native

voice

audio

sound
リンク
DeNA×AI｜“AIオールイン”で創るDelight
DeNAは、AIの大波を捉えるために、全社をあげてAI活用と新しい事業の立ち上げに取り組んでいます。資金調達、Go to Market、自社に最適なAIツール、グローバルチームとの連携、アクセラレータープログラムなどに興味をお持ちの方にイベントの情報の提供を行なっております
masterq 2021/05/13
ai

voice

avatar

japanese

audio

vocaloid

pytorch
リンク
【検証】skypeのデータ通信量と1GBまでの目安。他の通話アプリで節約？ | ネトセツ
記事を読んでも悩みが解決できない場合、ネット通信・回線を良いもの＆費用を安くしたい場合など、どこに相談したらいいか迷っている方は直接ネトセツへ気軽にご相談ください。公式LINEから相談 ▶ LINE＠ SNSから相談 ▶ X（旧Twitter）DMにて
masterq 2021/03/10
"5分の音声通話でのデータの消費量は「3.1MB」"/"LINEの音声通話と比較してみるとskypeの音声通話の方が多少多いという結果"

line

skype

voice

call

chat

money
リンク
ディープラーニングの力で誰でもゆかりさんの声になれる声変換技術を作ってみた
「誰でも」「高品質に」ゆかりさんの声になれる声変換技術を作りました。また一歩、結月ゆかりになるという夢に近づけた気がします。～Q&A～Q. 生放送で使える？A. 現状だと声変換に数十秒かかるので難しいです。生放送用途だとリアルタイムYukarinがおすすめです。sm35735482Q. ゆかりねっととの違いは？A. テキスト以外の情報も利用するので、笑ったり怒ったりできます。Q. 公開予定は？A. 声変換システムの配布予定はありませんが、技術解説はブログにて公開しています。また、声変換にご興味ありましたら、ツイッターなどでご連絡いただけるととても嬉しいです。-----------------------------------・ツイッターhttps://twitter.com/hiho_karuta・技術解説ブログhttps://blog.hiroshiba.jp/everybod
masterq 2020/12/28
これすごい

voice

girl

ai

convert

deeplearning
リンク
楽曲をパートごとに分解する「音源分離技術」はクリエイターの夢か、著作権の悪夢か
masterq 2020/08/13
music

sound

voice

ai
リンク
1 2 3 次のページ