在相同的硬件配置下,Big Bird所能够处理的序列长度是BERT的8倍(与longformer一样)。由于能够处理较长的上下文,Big Bird在多个NLP任务数据集如问答和 ...
確定! 回上一頁