Transformer结构Transformer模型中采用了encoer-decoder 架构encoder,包含self-attention层和前馈神经网络,self-attention能帮助.
確定! 回上一頁