之前在改自定义的DataSet的时候,由于在getitem()里面写了太多操作,导致训练过程贼慢,于是考虑用多线程优化一下。查阅一些资料发现pytorch在DataLoade...
IP属地:澳门
之前在改自定义的DataSet的时候,由于在getitem()里面写了太多操作,导致训练过程贼慢,于是考虑用多线程优化一下。查阅一些资料发现pytorch在DataLoade...
DIEN 是阿里妈妈在9月份公开的一个点击率预估模型。论文中提到的技术点十分值得去研究和尝试一下。之前做了一个slides,今天抽时间将它整理出来~ 主要从以下几个角度介绍。...
前言 目前提高机器学习算法性能的方法几乎都用多模型ensamble,在计算上非常昂贵且难以部署,尤其是大型神经网络,比如bert。知识蒸馏就是希望用小型模型得到跟大型复杂模型...
1 概念 归一化:1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。2)把有量纲表达式变成无量...
DSSM 的原理很简单,通过搜索引擎里 Query 和 Title 的海量的点击曝光日志,用 DNN 把 Query 和 Title 表达为低纬语义向量,并通过 cosine...
outline 近段时间在研究搜索的相关技术,在工作中主要涉及到资讯搜索功能的实现。我们采用了elasticsearch搜索引擎,之前整理了两篇关于elasticsearch...
正常情况下,Shell脚本是串行执行的,一条命令执行完才会执行接下来的命令。如下代码: 脚本执行的结果如下: echo $1 命令串行执行,如果命令耗时较长导致总时间较长。如...