タグ

AIとITmediaに関するtyosuke2011のブックマーク (2)

  • ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換

    ドワンゴは9月14日、ディープラーニング技術を活用したボイスチェンジャー「Seiren Voice」をWebサイトで無償公開した。デモページでは、声を録音して変換先の声を選び、変換ボタン押すと自分の声を100人分の声に変換できる。 録音した音声を加工するのではなく、目標の人物の声に変換するもの。選べるターゲットの数は100種類。変換のリアルタイム性より変換品質を優先しており、変換には数十秒から数分の時間がかかる。 既存の声質変換システムはリアルタイムに変換するものが多く、品質を重視したものはあまり見かけないとして開発に挑んだという。音声の合成には、スマートスピーカーなどで使われるWaveNetという方式から派生したWaveRNNを採用した。 ディープラーニングを使った声質変換では、変換前の声と目標とする人物の声をセットで学習する手法がとられることがある。この手法ではボイスチェンジャーを使い

    ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換
  • 人工知能で白黒写真をカラーに 早大が技術開発、GitHubでコード公開

    早稲田大学の研究グループはこのほど、ディープラーニングを応用し、白黒写真を自然な色に自動彩色する手法を確立したと発表した。プログラムのソースコードをGitHubで公開している。 新技術は、大量の白黒・カラー画像の組から、色づけの手がかりとなる特徴をディープラーニングにより学習し、その特徴を使って白黒画像をカラーに変換する技術。従来、白黒写真の色づけには人手が必要だったが、新技術なら全自動で彩色できる。 画像全体から抽出する「大域特徴」と、小さな領域から算出する「局所特徴」を結びつけて利用することで、画像全体を考慮した自然な色づけができるという。 大域特徴からは、屋内か屋外か、昼か夜かなど画像全体の情報を得、局所特徴からは、水か砂か葉かなど物体の質感を判断し、その領域をどう色づけするかが最も適当か推測。この組み合わせにより、夕暮れの空や人の肌など、状況に合った自然な色づけが可能になったという

    人工知能で白黒写真をカラーに 早大が技術開発、GitHubでコード公開
  • 1