我正在使用Librosa构建用于语音识别的CNN。我已经为每个音频文件提取了MFCC,并对音频数据进行了预处理。音频数据的维度为(93894,8000),MFCC的维度为(93894,26,16) ...
確定! 回上一頁