米Googleは8月24日(現地時間)、音声認識機能搭載アプリ開発向けの基本的な音声命令のデータセット「Speech Commands Dataset」をオープンソースで公開したと発表した。公式ブログ内のリンクをクリックすると圧縮ファイルをダウンロードできる。 Speech Commands Datasetは、同社の機械学習ライブラリ「TensorFlow」を手掛けるチームと、人工知能(AI)向けハードウェアキット提供プロジェクト「AIY(Artificial Intelligence Yourself) Projects」チームが共同で開発したもの。 データは、「Yes」「No」「Stop」「Go」など、音声サービスでよく使われる30個の英単語を、数千人のボランティアが読み上げたもので、長さ1秒の録音6万5000件が収録されている。 この録音は、AIYが公開しているWebサイトを通じて集