1 BERT简介 BERT是2018年google 提出来的预训练的语言模型,并且它打破很多NLP领域的任务记录,其提出在nlp的领域具有重要意...
BERT论文地址:https://arxiv.org/abs/1810.04805翻译 https://arxiv.org/pdf/1810.0...
原文 https://pytorch.org/docs/stable/distributed.html 后端 torch.distributed...
原文 https://pytorch.org/tutorials/intermediate/dist_tuto.html#writing-dis...
1. 数据增强Data Augmentation 数据增强让有限的数据产生更多的数据,增加训练样本的数量以及多样性(噪声数据),提升模型鲁棒性。...
1 前言 在实现一个优秀人脸识别系统的过程中,应该有以下重要环节。1、干净而且大量的数据。2、优秀的网络结构。3、优秀的网络指挥棒(损失函数)。...
1.前言 近年来随着硬件计算能力的大爆发,在高性能计算的支持下深度学习有了革命性的进步,在互联网大数据的保证下深度学习有了持续不断的动力,优秀的...
1.极大似然估计 众所周知,极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中...
1 模型的选择(选超参数) 交叉验证(Cross validation),用于防止模型过于复杂而引起的过拟合,有时亦称循环估计。 它是一种统计学...