既然是在Attention bias 计算中丢失了相对位置信息,一个很Naive 的想法 ... 为了适应Embedding 拓展到复数域,RNN,LSTM, Transformer 的计算也应该 ...
確定! 回上一頁