タグ

ブックマーク / aismiley.co.jp (2)

  • OpenAIの文字起こしAI「Whisper」の使い方 | DXを推進するAIポータルメディア「AIsmiley」

    OpenAIが発表した音声認識モデル「Whisper」は、日語の音声でも精度高く文字起こしできるツールとして知られています。今回はAIsmiley編集部が「AIニュース原稿の読み上げ音声を素材にどのくらい精度高く文字起こしできるのか」や「生活騒音下における読み上げ音声でも結果は変わらないのか」について調べてみましたので是非やり方を真似して試してみてください。 ■音声認識モデルとは? 音声認識モデルとは、AIが人間の声を認識し、認識した音声をもとに何らかのデータをアウトプットする技術を指します。身近な音声認識モデルには、アレクサでお馴染みのAmazon Echoがあります。Amazon Echoなどのスマートスピーカーは、人間の声を認識し、その音声の意図を把握した後、情報検索を行ったり、接続されている電化製品の操作を行ったりします。 スマートスピーカーの他にも、入力された音声をリアルタイム

    OpenAIの文字起こしAI「Whisper」の使い方 | DXを推進するAIポータルメディア「AIsmiley」
  • AIでRCカーを走らせよう!Maker Faire Tokyo 2022 イベントレポート

    2022年9月3日(土)、9月4日(日)に東京ビックサイトで「Maker Faire Tokyo(以下、MFT)」が開催され、このイベントにおいて「AIでRCカーを走らせよう」という取り組みが行われました。 このイベントに株式会社エヌ・ティ・ティピー・シーコミュニケーションズ(以下、NTTPC)がAIコラボレーションプログラム「Innovation LAB」の取り組みの一つとして、参加しました。 イベントの様子を、メディアパートナー、AIsmileyが写真を中心にお届けします。 ※新型コロナウイルス感染予防対策を行い、ソーシャルディスタンスを確保した上で撮影しています。 様々な企業のエンジニアが参加するコミュニティ 今回参加したコミュニティは、FBグループ「AIでRCカーを走らせよう!」と某自動車メーカーの「自動運転ミニカーバトル」チームなどで構成されており、大手自動車メーカーや模型メーカ

    AIでRCカーを走らせよう!Maker Faire Tokyo 2022 イベントレポート
  • 1