タグ

2023年6月3日のブックマーク (3件)

  • 日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた | DevelopersIO

    こんちには。 データアナリティクス事業機械学習チームの中村です。 記事では、株式会社レアゾン・ホールディングスが2023年1月18日に公開したReazonSpeechを使ってみたいと思います。 ReazonSpeechはプロダクト群の総称で、日語に特化した超高精度なモデルと、その学習に使用されたコーパス、コーパス作成のためのツールなどが公開されています。 詳細は下記リンクを参照ください。 モデルの方は、ライセンスがApache-2.0となっており商用利用も可能な形となっています。 コーパスはテレビなどの音声となりますので、CDLA-Sharing-1.0 (ただし利用目的は著作権法30条の4に定める情報解析に限る)とされています。 今回はこのモデルをColab上で動かして、以前投稿したWhisperなどと比較してみたいと思います。 実行手順は下記の以前の記事も参考にされてください

    日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた | DevelopersIO
    faibou
    faibou 2023/06/03
  • 【MediaPipe + KalidoKit】ブラウザでリアルタイム顔認識して遊ぶ

    こんにちは、@d_etteiu8383です。この記事は夏のブログリレー 2022年 28日目の記事です。 概要 記事ではMediaPipeのFaceMeshとKalidoKitを利用して、ブラウザ上でリアルタイムに顔認識を行う方法について説明します。 イントロ 突然ですが日9月6日が何の日だかご存じでしょうか?そうです、真中のんさんの誕生日ですね。 彼女はアニメ『プリパラ』の登場人物の一人ですが、このアニメは3DCGを利用したライブシーンが特徴的ですよね。3Dと言えば<!-- ここにこじつけ理由を書く -->というわけで記事ではMediaPipeのFaceMeshとKalidoKitを利用した、ブラウザ上でのリアルタイム顔認識について説明します。 MediaPipe Face Mesh overview: https://google.github.io/mediapipe/solu

    【MediaPipe + KalidoKit】ブラウザでリアルタイム顔認識して遊ぶ
    faibou
    faibou 2023/06/03
  • Developers.IO 2018 で「API 設計」の話をしてきた #cmdevio2018 | DevelopersIO

    緊張すると声がアムロ・レイになる都元です。 ここからしばらく、キャッチコピーの迷走期が始まりますのでよろしくお付き合いください。 さて、去る 10/5 (金) 秋葉原 UDX にて開催された Developers.IO 2018、その中で 「クラスメソッドにおける Web API エンジニアリリングの基的な考え方と標準定義」 という仰々しいタイトルで1講座持たせていただきました。 スライド 話したかったことと、話したこと セッションで話したかったことはだいぶ多岐にわたり、当然 40 分では話しきれないので、当初は次の 2 テーマに絞ってお話しようと考えてスライドを作っていました。 アプリケーション動作ログガイドライン RESTful / リソース指向 API 設計 しかし実際にスライドを作ってみると、それぞれで 40 分の規模となってしまい…。 ログの話は断腸の思いで見送りとさせていた

    Developers.IO 2018 で「API 設計」の話をしてきた #cmdevio2018 | DevelopersIO