音声強調、音声認識や音環境分類のような音データにおけるデータ拡張方法であるSpecAugmentをPyTrochで試す。PyTorchには、FrequencyMasking、TimeMaskingとTimeStretchの3つのクラスが用意されている。 torchaudio.transforms – Torchaudio v0.10.0 Documentation データ拡張する対象の音源を、以下コードでダウンロードし、スペクトログラムに変換する。 関連記事 – 【PyTorch】Pythonで時間波形からスペクトログラムへ変換【librosa】 import os import requests import librosa import matplotlib.pyplot as plt import torch import torchaudio import torchaudio.t