... 发现网上关于BiLSTM 加Attention 的实现方式五花八门,其中很多是错的,自己基于PyTorch 框架实现了一版,主要用到了LSTM 处理变长序列和masked softmax两个技巧。
確定! 回上一頁