唇の動きだけの音声なし映像をスマートフォンのインカメラで自撮りし深層学習で分類、意図した音声に変換する。照明条件が悪くても補正する前ステップ導入。訓練用データセット2万1635本,テスト用7140本。

SeamlessSeamless のブックマーク 2021/09/01 08:17

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

読唇術で音声入力 スマホで口パクを自撮りし音声に変換「LipType」

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米カリフォルニア大学...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう