こんちには。 データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。 pyannote.audio v3が2023/09/26に公開されました。 少し使い方の異なる部分がありましたので、ブログを再度投稿します。 以下は過去のpyannote.audio v2のブログとなりますので、こちらも併せてご参照ください。 pyannote.audioとは pyannote.audioとは話者ダイアライゼーションを行うライブラリです。 ベースのフレームワークはPyTorchとなっており、end-to-endの話者ダイアライゼーションを実現します。 話者ダイアライゼーションとは、どこの時間でどの話者がしゃべったのか、話者認識をせずに実施する技術のことを指します。 v3のアップデートについては以下に記載があります。 v3のポイントをいくつかピックアップしました。 より良い性能をもつ