タグ

2018年10月19日のブックマーク (9件)

  • 自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか (2/2) - ITmedia NEWS

    「なぜ、ボーカロイドはうまく調整してもどこか“機械っぽさ”が抜けないのか」という質問に対しては、「ああいったものは従来の数理モデルを利用しています。数理モデルは実際の現象をかなり単純化しているので、そこで大きな劣化が生まれているのが1つの要因」だと戸田教授はいう。WaveNetには単純化や近似といった、大きな劣化を生むプロセスがないことが特筆すべき点だ。 音声認識もニューラルネットワークで精度向上 「スマホ普及」も寄与 音声認識では、音声から文を推定するメジャーな方法として、得られた音声波形から「スペクトログラム」という、波形を短時間で切った周波数成分(音色)を時系列に並べたものをまず作成する。このスペクトログラムに適切な数理モデルを使用することで文を推定していく。 「従来よく使われてきたのが『隠れマルコフモデル』(HMM)という統計学の確率モデルで、このモデルではどこからどこまでが1つの

    自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか (2/2) - ITmedia NEWS
    schrift
    schrift 2018/10/19
    “「データを集めることは企業に任せて、大学の研究者はそれ以外の部分にフォーカスした方がいいかもしれません」(戸田教授)”
  • 自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか

    2017年、米Googleや米Amazonなどの「スマートスピーカー」と呼ばれるデバイスの普及が日で始まった。例えば、「ねえGoogle、今日の予定は?」と話しかけると、カレンダーアプリに入力していた予定を流ちょうな日語で読み上げてくれる。中に人がいるわけではない。デバイスが人の声を認識し、応答となる声を合成しているのだ。 このデバイスが音声で応答するために使用しているコアの技術は、「音声認識」と「音声合成」という2つの技術だ。音声認識は人の声の波形を機械で処理し、どんな文であったかを推定する技術音声合成は与えられた文やデータから、人が話す音声を合成する技術だ。 ここに、音声認識で推定した文に対して適切な応答文を出力する「対話制御」という技術が加わり、「人の話を聞いて適切な応答を音声で返す」という一連の動作を実現している。 音声認識・合成ともに、コンピュータを利用した研究は1950年

    自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか
    schrift
    schrift 2018/10/19
    “戸田教授は「WaveNetのようなものが出てくるのはあと10年かかると思っていた」と、その衝撃を振り返る。 ”
  • クラシック音楽に隠された「進化の法則」、京大の研究者ら発見

    京都大学の中村特別研究員と東京大学の金子教授は、16世紀から19世紀における西洋音楽の様式の変化が、進化のプロセスで説明できることを明らかにした。この研究で採ったアプローチは、言語やファッション、科学の進歩など他の文化的現象の理解にも役立つ可能性がある。 by Emerging Technology from the arXiv2018.10.03 254 423 25 0 音楽学者たちは長年にわたり、音楽の様式が時とともにどう変化するのかを研究してきた。新たな様式が音楽の伝統から生まれ、時には2つ以上の様式の組み合わせから生じることは分かっている。 音楽の様式が変化していく様子は、進化のプロセスを連想させる。強力なプロセスである進化が、生物学的な状況に影響を与えるのと同一の、よく知られた伝播の法則に基づいて、音楽の状況を形成してきたということはあり得るのだろうか。それとも、音楽の進化は作

    クラシック音楽に隠された「進化の法則」、京大の研究者ら発見
    schrift
    schrift 2018/10/19
  • ほぼ無音の「吸った声」で音声認識 マイクロソフト研究 (ITmedia NEWS)

    さんやないですか。 昔は日人研究者がそれなりにいたMSRA(マイクロソフト・リサーチ・アジア)もいまは少なくなってしまって、いまは福さんお一人。逆に卒業生の皆さんは日を始め世界でご活躍なので喜ばしいことではあります。 #今週開催されたUIST18でBest Talk Awardを受賞された模様。

    ほぼ無音の「吸った声」で音声認識 マイクロソフト研究 (ITmedia NEWS)
    schrift
    schrift 2018/10/19
  • Adobe Senseiの画像解析が凄すぎた! Adobe MAXで14000人を狂喜乱舞させた研究中の技術

    これほんとすごいと思います。 鼻歌さえ口ずさめれば曲が作れる時代に…。 クリエイティブの形が大きく変わりそうな予感がします。

    Adobe Senseiの画像解析が凄すぎた! Adobe MAXで14000人を狂喜乱舞させた研究中の技術
    schrift
    schrift 2018/10/19
  • ほぼ無音の「吸った声」で音声認識 マイクロソフト研究 - ITmedia NEWS

    「音声入力は楽だが、人前で話すのは恥ずかしいし聞かれたくない」――こんな問題を解決してくれるかもしれない、新しい音声認識技術を米Microsoft Researchが10月5日(現地時間)に発表した。ひそひそ声よりも小さな声での音声認識を可能にする。 「サイレントボイス」と名付けられたこの技術は、一般的な「息を吐いての発声」ではなく、「息を吸っての発声」から音声を認識する。 通常の発声では声帯を震わせて空気を振動させ、声道や鼻腔などで共鳴して声になる。ひそひそ声も声帯こそ震わせないが、声帯の狭い隙間を通る際にノイズ音を発生させ、通常の声と同様の経路を通って声となる。 一方の息を吸う「サイレントボイス」では、マイク付きのプレートを唇に当てることで、唇とプレートの間の狭い隙間から息を吸う際に発生するひそひそ声のような音を認識する。 サイレントボイスの利点は大きく2点。息を吐く発声と違い、ポップ

    ほぼ無音の「吸った声」で音声認識 マイクロソフト研究 - ITmedia NEWS
    schrift
    schrift 2018/10/19
  • Adobe Senseiの画像解析が凄すぎた! Adobe MAXで14000人を狂喜乱舞させた研究中の技術 - ICS MEDIA

    Adobe Senseiの画像解析が凄すぎた! 14000人から拍手喝采を浴びた研究中の技術 (Adobe MAX 2018) 米アドビシステムズが主催のクリエイティビティ・カンファレンス「Adobe MAX 2018」(ロサンゼルス)。2日目の10月16日は「スニークス」と題してAdobeの研究中の技術が発表されました。スニークスはAdobe MAXで最大の盛り上がりをみせる恒例の人気イベントです。 ▼「スニークス」が開催されたのは2018年10月16日(米国時間) ここで発表されたものは現時点では製品に搭載されていないものの将来的に製品に組み込まれるかもしれない技術。現地のイベントに自費参加したスタッフ(池田 @clockmaker)がレポートします。 今年は、画像解析にAIの「Adobe Sensei」を活用した次世代技術が多く扱われました。 ▼Adobe MAX 2018には14,

    Adobe Senseiの画像解析が凄すぎた! Adobe MAXで14000人を狂喜乱舞させた研究中の技術 - ICS MEDIA
    schrift
    schrift 2018/10/19
  • 瀧口修造と夢の漂流物。現代へ続く芸術の足跡

    こんにちは、なつきです。 『瀧口修造 夢の漂流物』という図録が初めてノストスに入荷したのが、今年7月のこと。そこに収録されているアート作品の数々は圧巻で、これまで何度もその名を目にしながらも、実は深く入り込んだことのなかった「瀧口修造」という人物に、初めて強く興味を惹かれた瞬間でした。 そして氏の歩みを辿っていくうちに、感動を通り越して感謝の気持ちが湧いたのです。当時、海外と日の架け橋となり、また若き芸術家を応援し続けた氏の存在があったからこそ、いまこうして私達が素晴らしい作品に触れることができるのだなと。 ということで、今回は瀧口修造と、氏を取り巻いた芸術家たちについて紹介したいと思います。 1903年、祖父の代から医者という家庭の長男として生まれた瀧口修造。幼少期から父の書斎がわりの一室で、文芸書や雑誌などに触れて育ちました。 運命的な出来事が起こったのは、應義塾大学在学時。イギリス

    瀧口修造と夢の漂流物。現代へ続く芸術の足跡
    schrift
    schrift 2018/10/19
  • タイガー立石の超絶多次元世界。ここは宇宙の果てか、重箱の隅か | nostos books ノストスブックス

    こんにちは、石井です。 日はひとりの画家とその作品集にフォーカスを当てて紹介したいと思います。その名はタイガー立石。またの名を立石大河亞。名は立石紘一。 タイガー立石は1964年に同じく画家の中村宏とともに「観光芸術協会」を結成。時は60年代、既存の芸術の枠組みを逸脱せんとする「反芸術論」がさかんな時代。観光芸術と称して日的なポップ・アートを次々と発表し、1960年代後半からは活動の場を漫画の世界へと移します。世代の近い漫画家・赤塚不二夫と相互に影響を与え合いつつ、ナンセンスな笑いを生み出しました。 ところが漫画家として順調に歩み始めた矢先ともいえる1969年、タイガー氏は突如イタリアへ移住してしまいます。事務機器メーカー・オリベッティ社のエットーレ・ソットサス工業デザイン研究所に嘱託として在籍し、デザインの仕事に携わりながら絵を描き続け、ニューヨーク、パリなどで展示を開催。着々と生

    タイガー立石の超絶多次元世界。ここは宇宙の果てか、重箱の隅か | nostos books ノストスブックス
    schrift
    schrift 2018/10/19