筆者の環境 macOS version14.5 Python3.12 GitHub コード以外で必要なもの メディアファイル(音声又は動画)を用意する 話者分離も行う場合は、HuggingFaceのトークンを用意する(手順については後述) GPU搭載のPCがあればVeryGood(筆者の家にはない) ネタバレ(コピペ用) クリックして表示 # transcription.py import json import math import mimetypes import os from datetime import timedelta from typing import Iterable import pandas as pd import torch import torchaudio from faster_whisper import WhisperModel from fast
