Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 ... のConvolutionネットワークだとbi-gram特徴を見ていることとほぼ同義といえます.
確定! 回上一頁