pytorch 也自己实现了transformer的模型,不同于huggingface或者其他 ... attn_mask: 2D mask :math:`(L, S)` where L is the target sequence length, ...
確定! 回上一頁