MFCC 考量了人耳對不同頻率聲音的辨別程度,並取他們的平均值、標準差等統計資訊。 接著,以2至3層雙向LSTM(bi-directional Long Short-Term Memory)模型 ...
確定! 回上一頁