240 发简信
IP属地:四川
  • 基于 BERT 的项目实战(NER、Classification)

    1 BERT简介 BERT是2018年google 提出来的预训练的语言模型,并且它打破很多NLP领域的任务记录,其提出在nlp的领域具有重要意义。预训练的(pre-trai...

  • 120
    BERT论文翻译

    BERT论文地址:https://arxiv.org/abs/1810.04805翻译 https://arxiv.org/pdf/1810.04805.pdf BERT:预...

  • 分布式通信包 - torch.distributed

    原文 https://pytorch.org/docs/stable/distributed.html 后端 torch.distributed 支持三个后端,每个后端具有不...

  • 120
    使用PyTorch编写分布式应用程序

    原文 https://pytorch.org/tutorials/intermediate/dist_tuto.html#writing-distributed-applic...

  • 深度学习中的数据增强与实现

    1. 数据增强Data Augmentation 数据增强让有限的数据产生更多的数据,增加训练样本的数量以及多样性(噪声数据),提升模型鲁棒性。神经网络需要大量的参数,许许多...

  • 人脸项目实践

    1 前言 在实现一个优秀人脸识别系统的过程中,应该有以下重要环节。1、干净而且大量的数据。2、优秀的网络结构。3、优秀的网络指挥棒(损失函数)。4、由以上1,2,3决定一个优...

  • 120
    人脸识别项目,网络模型,损失函数,数据集相关总结

    1.前言 近年来随着硬件计算能力的大爆发,在高性能计算的支持下深度学习有了革命性的进步,在互联网大数据的保证下深度学习有了持续不断的动力,优秀的网络结构被不断提出,深度学习技...

  • 120
    EM 期望最大算法

    1.极大似然估计 众所周知,极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是...

  • 120
    交叉验证、模型评估

    1 模型的选择(选超参数) 交叉验证(Cross validation),用于防止模型过于复杂而引起的过拟合,有时亦称循环估计。 它是一种统计学上将数据样本切割成较小子集的实...

  • 120
    摄像头RTSP流硬解码

    1. 问题分析 项目中,之前用的是OpenCV对摄像头的RTSP流进行解码。随着时间的推移以及业务摄像头的增加,发现十路流CPU就已经100%啦,很明显解码所占CPU资源较多...

  • 120
    Word2Vec的CBOW与Skip-Gram模型

    word2vec是google在2013年推出的一个NLP工具,它是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。 1 词向量基础 用词...

  • 输入TextCNN的shape(文本总行数,文本最大长度) 这里文本总行数就是句子总数,文本最大长度就是最大词数。词向量的维度是取决于内部的CNN。learn.preprocessing.VocabularyProcessor 把文本转为词ID序列。

    基于Text-CNN模型的中文文本分类实战

    1 文本分类 文本分类是自然语言处理领域最活跃的研究方向之一,目前文本分类在工业界的应用场景非常普遍,从新闻的分类、商品评论信息的情感分类到微博信息打标签辅助推荐系统,了解文...

  • 120
    基于Text-CNN模型的中文文本分类实战

    1 文本分类 文本分类是自然语言处理领域最活跃的研究方向之一,目前文本分类在工业界的应用场景非常普遍,从新闻的分类、商品评论信息的情感分类到微博信息打标签辅助推荐系统,了解文...

  • 一个完整机器学习项目流程总结

    现在机器学习应用越来越流行,了解机器学习项目的流程,能帮助我们更好的使用机器学习工具来处理实际问题。 1 理解实际问题,抽象为机器学习能处理的数学问题 理解实际业务场景问题是...