这样就能利用Query Stream 在对需要预测位置进行预测的同时,又不会泄露当前位置的内容信息。具体操作就是用两组隐状态g和h 。其中g 只有位置信息,作为Self-Attention 里 ...
確定! 回上一頁