Googleが、クラウドソーシングで集めた6万5000件の短い英単語の音声録音のデータセット「Speech Commands Dataset」をオープンソースで公開した。Mozillaも年内の1万時間分のデータ公開を目指している。 米Googleは8月24日(現地時間)、音声認識機能搭載アプリ開発向けの基本的な音声命令のデータセット「Speech Commands Dataset」をオープンソースで公開したと発表した。公式ブログ内のリンクをクリックすると圧縮ファイルをダウンロードできる。 Speech Commands Datasetは、同社の機械学習ライブラリ「TensorFlow」を手掛けるチームと、人工知能(AI)向けハードウェアキット提供プロジェクト「AIY(Artificial Intelligence Yourself) Projects」チームが共同で開発したもの。 データは
![Google、音声認識システム訓練用データセットをオープンソースで提供](https://cdn-ak-scissors.b.st-hatena.com/image/square/1907d4bb4c90d746d008bdf0fe76337e6a532a46/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fnews%2Farticles%2F1708%2F28%2Fl_yu_voice1.jpg)