LAS 架构主要由3 个部分组成,分别是Listener(Encoder)、Attender、Speller(Decoder)。 Encoder 的功能与传统的声学模型类似,接收输入语音的特征 ...
確定! 回上一頁