作者們用了8 個NVIDIA P100 GPU,花了3 天半訓練了一個Transformer,而該模型 ... 你也可以一邊執行TensorFlow 官方的Colab 筆記本一邊參考底下實作。
確定! 回上一頁