240 发简信
IP属地:浙江
  • 240
    fairseq

    数据处理阶段 基于pytorch的一个不得不学的框架,听师兄说最大的优势在于decoder速度巨快无比,大概是t2t的二十几倍,而且有fp16加持,内存占用率减少一半,训练速...