policy_loss = torch.cat(policy_loss).sum() ... 一个使用 torch.cat ,另一个使用 torch.stack 。 据我所知,the doc并没有明确区分它们。
確定! 回上一頁