
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国のZhejiang UniversityとWuhan Universityの研究チームが発表した論文「V-CLOAK: Intelligibility-, Naturalness- & Timbre-Preserving Real-Time Voice Anonymization」は、音声の明瞭性と自然性、音色を保持したまま、リアルタイムに音声を匿名化するシステムを提案した研究報告だ。機械的な声ではなく人間っぽさを残した声に変換し、声紋から個人が特定されることを防ぐ。 声紋は、個人を一意に特定できる重要なバイオメトリクスだ。一方でオンラインサービスによって膨大な音声データを収集・処理で
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Dolby LaboratoriesとスペインのUniversitat Pompeu Fabraの研究チームが開発した「Universal Speech Enhancement With Score-based Diffusion」は、収録した映像のバックグラウンドノイズ(背景雑音)を強力に除去する技術だ。動画撮影した雑音を消し去り、話す声だけをくっきり残すことができる。強力すぎるため、映像がアフレコを挿入したみたいな仕上がりになってしまう。 実世界で録音した音声には必然的に背景の雑音や残響が含まれ、不快感や明瞭度の妨げになるためノイズ除去が行われる。最近では深層学習の登場によりノイズ除
どうも、まさとらん(@0310lan)です! 今回は、単純なマークダウンファイルから動画を生成してダウンロードできるWebサービスをご紹介します! ブログ記事を書くようにテキストデータを動画に変換できるうえ、自然な日本語音声も自動生成してくれます。また、画像や音楽などのメディアも挿入できるので、チュートリアル動画やPR動画などさまざまな作品を作ることができます。 現在はベータ版で全機能を無料で使えるため、動画作成にご興味がある方はぜひ参考にしてみてください。 【 Video Puppet 】 ■「Video Puppet」の使い方 それでは、最初に「Video Puppet」をどのように使うのか詳しく見ていきましょう! トップページにアクセスしたら、画面上部にある【SIGN UP】ボタンから無料のユーザー登録をしておきます。 (※登録しなくても制限付きで利用することは可能です) ユーザー名
特別な訓練を受けたプロフェッショナルによる職業というイメージが強いアナウンサーや声優の仕事を、音声合成で代替できるようになってきた。 NTTテクノクロスで音声合成サービスを開発する鳥居崇マネージャー(メディアイノベーション事業部 第二ビジネスユニット)は、「AIアナウンサーは今後確実に増えていく」と話す。 「地方のローカル局ではアナウンサーが足りていない所もある。働き方改革の取り組みとして、深夜の地震速報などを機械で代替したいという需要はある」(鳥居マネージャー) 同社は、声優の梶裕貴さんの声も再現。梶さんの声を音声合成のデータベースとして構築し、艶のある渋い声の特徴を忠実に再現したとしている。
臨場感の高いスポーツ放送を スポーツ中継で、選手の会話やプレー音が鮮明に聞こえるかもしれない――。 リオンと東北大学電気通信研究所先端音情報システム研究室は2016年9月、音空間の情報をリアルに集音可能な実用レベルの64チャンネル球状マイクロフォンアレイシステムの開発に成功したと発表した。 さらに、この球状マイクロフォンアレイシステムを無響室(音の反射がほとんどない部屋)で2台用いて、目的音とマイクロフォンの間に妨害音がある状況でも、妨害音のエネルギーを10分の1以下に減少させ、目的音を抽出することにも成功している。 これにより、従来のように指向性の高いマイクロフォンを音源に向け続ける必要がなく、妨害音がある状況でも音源のみを抽出できる。スポーツ競技のテレビ中継で、選手たちの会話やプレー音などを抽出し、臨場感のある中継の実現が期待できる。なお、同研究は、東北大学電気通信研究所の産学共同マッ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く