Discover amazing ML apps made by the community
![Moe TTS - a Hugging Face Space by skytnt](https://cdn-ak-scissors.b.st-hatena.com/image/square/431f69e011c2111d7515403d79216958c03164cf/height=288;version=1;width=512/https%3A%2F%2Fcdn-thumbnails.huggingface.co%2Fsocial-thumbnails%2Fspaces%2Fskytnt%2Fmoe-tts.png)
Discover amazing ML apps made by the community
NVIDIA RTX Voice is a new plugin that leverages NVIDIA RTX GPUs and their AI capabilities to remove distracting background noise from your broadcasts, voice chats, and remote video conferencing meetings. This allows users to "go live" or join a meeting without having to worry about unwanted sounds like loud keyboard typing or other ambient noise in noisy environments. RTX Voice also suppresses bac
クリムゾンテクノロジーが開発したリアルタイムボイス変換AI(人工知能)技術「リアチェンvoice」を応用した。メガホンで発話する人の声を解析し、あらかじめ学習させた別人の声としてほぼ遅延なく出せるという。 一般にボイスチェンジャーは、声の音程や音質をフィルタリングして変化させるが、ANIMEGAPHONEには、言語やイントネーションなどを保ちながら声質を変換するシステムを「メガホン単体」に搭載したという。 現段階ではレンタルでの提供を想定し、試用を希望するイベント主催者などを公式サイトで受け付ける。提供価格などは、複数の実地テストを行った後、設定する。 第1回の実地テストはガレージキットのイベント「ワンダーフェスティバル」(2月18日、千葉・幕張メッセ)で行う予定。ワンダーフェスティバルでは、声優の平田広明さん、小岩井ことりさんの声を事前登録したメガホンを使う。 関連記事 誰でも「美少女バ
NVIDIAの音声入力から3D顔面モデル・アニメーションを駆動させる機械学習ベースの技術がSIGGRAPH 2017にて採択 2017-05-24 NVIDIAが開発する機械学習を用いたオーディオ駆動の3Dフェイシャル・アニメーション技術がSIGGRAPH 2017にて採択されました。論文はこちら(PDF)。 本提案は、俳優の音声入力から話すスタイルを3Dモデル化し、表情含め動的に低レイテンシおよびリアルタイムに動作させることを可能にします。 本提案で同社が用いる機械学習技術ディープニューラルネットワークは、音声の入力波形から顔モデルの3D頂点座標へのマッピングを学習し、と同時にオーディオだけでは説明できない表情の変化も推論し明確にします。 性別、アクセント、言語が異なる多様なスピーカーの音声で駆動しても合理的な結果をもたらしました。 説明映像はこちら。 関連 アクター(俳優)とキャラクタ
ベテラン声優、山寺宏一の意外な胸の内 今年の『ポケモン・ザ・ムービーXY&Z「ボルケニオンと機巧(からくり)のマギアナ」』を含め、これまでのポケモン映画に全て違う役柄で出演し続けている、キャリア31年のベテラン声優・山寺宏一が、俳優と声優の演技の違いについて持論を展開。声優・俳優業をこなす山寺は、「全然、違うとも思わないんですけど、違うんでしょうね」と語る。 【映像】市川染五郎&中川翔子&山寺宏一インタビュー 動画 役者と声優の仕事は違うとよく聞く。実際、本作で初のアニメ声優を務め、山寺を“芸能界の父”と慕う「おはスタ」元おはガールの松岡茉優は、山寺に1時間半以上電話で相談したという。山寺は当時のことを振り返り、「『茉優は女優なんだから大丈夫』と答えたら、表現の仕方が違うという。どんな役でもできる子ですけど、声優はかけ離れたものに感じたんでしょう」と話す。またそう感じているのは松岡だけでは
ToScribeとは 『ToScribe』は、会議などを録音した音声データから参加者の発言内容を文字に起こす「音声書き起こし」の作業環境をブラウザベースで提供する「音声データ書き起こし支援サービス」(完全無料)です。 インターネットに接続できる環境があれば、どこに居てもサーバに保存されたデータで書き起こし作業を行うことができます。 (株)東芝で開発された音声・言語処理技術を利用した以下のような作業支援機能があります。 自動頭出し機能 テキスト中のカーソル位置から音声再生を開始できます。 校正支援機能 (整文支援) 書き起こした文章の文末・表記のゆれ、誤字・脱字などを検出してお知らせします。 話者分類機能 音声データに登場する発言者を分類して、各発言の話者を特定します。 聞きやすさ向上機能 (ノイズ除去・話速変更) エアコン・プロジェクターのファンノイズなどを抑え、音声を聞きやすくします。
Nuance AI solutions transform the way we work, connect, and interact with each other to advance the effectiveness of your organization and further your positive impact on the world. Build your future with outcomes-focused AI Together we bring industry‑leading AI and deep vertical expertise to address your biggest challenges and accelerate business results. From proven healthcare solutions to secur
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く