エンジニアコラム 広い技術領域をカバーする当社の機械学習エンジニアが、 アカデミア発のAI&機械学習技術を 紹介&解説いたします。 TV 録画から自動構築した音声コーパス 『LaboroTVSpeech』を公開 2020.11.19 株式会社Laboro.AI 代表取締役CTO 藤原 弘将 機械学習エンジニア 安藤 慎太郎(現:東京大学大学院工学系研究科) 概 要 Laboro.AIは、 当社の研究開発として、TV録画から長時間音声と字幕テキストを抽出して音声コーパスを自動構築する独自システムを用い、約2,000時間に及ぶ音声データから構築した日本語音声コーパス『LaboroTVSpeech(ラボロティービースピーチ)』を開発し、学術研究用に無償公開いたしました。 こちらのコラムでは、その概要についてご紹介いたします。 なお、当社では、データ量を約3倍に増量し、より高品質な音声データとして