The positional information is necessary for the transformer to make use of ... 转换矩阵 Q,将 y 经过 Key 转换矩阵 K,然后比较Query和Key向量的点积相似度。
確定! 回上一頁