RDNA 2 获得一些额外的点积运算指令,以帮助加速机器学习。例如,V_DOT2_F32_F16 将成对的FP16 值相乘、相加,然后添加一个FP32 累加器。它不像Nvidia的张 ...
確定! 回上一頁