Bert 是Multi-task的方式訓練,其中有兩個task,一個是NextSentencePrediction - 預測兩個句子是否前後文關係;一個是MaskLM,預測被MASK起來的字.
確定! 回上一頁