作者表明在视觉任务上,CNN并不是必须的,Transformer也可以很好的执行分类任务; ... 式2、式3为Transformer结构中Multi-Head self-Attention模块及MLP模块,如图1右 ...
確定! 回上一頁