Ptt 大爆卦 | Linear transformer - 前往 https://zhuanlan.zhihu.com/p/157490738

你即將離開本站

並前往https://zhuanlan.zhihu.com/p/157490738

线性Attention的探索：Attention必须有个Softmax吗？ - 知乎专栏

众所周知，尽管基于Attention机制的Transformer类模型有着良好的并行性能，但 ... Autoregressive Transformers with Linear Attention，了解到了线性 ...

確定！回上一頁

查詢「Linear transformer」的人也找了：

Linear transformer

Fast transformer

Autoregressive transformer

Long range Arena a benchmark for efficient Transformers

Reformer: THE efficient Transformer

Transformer complexity

Rethinking attention with Performers