1
0
TL;DR paper中的位置编码定义可以直观理解为 "钟表盘上每个针头的位置坐标" 跟直接拿index作为位置编码的方案相比,这种定义有两个优点可以使用不含bias的线性变...
写了 4949 字,被 13 人关注,获得了 23 个喜欢