缺点 :一般来说由于缺少类似于U-net中的skip connection的存在,auto-encoder重构出来的 ... K为一个图像的embedding (query) 的个数,T为视频的帧数.
確定! 回上一頁