****前言****无论是做开发还是做运维的程序猿,crontab命令是必须用到的命令,特别是对于运维的人,自动化运维中,crontab也属于其一。然而就来记录常用的cron...
****前言****无论是做开发还是做运维的程序猿,crontab命令是必须用到的命令,特别是对于运维的人,自动化运维中,crontab也属于其一。然而就来记录常用的cron...
背景 工作中使用Spark Streaming处理实时数据流,发现所处理的数据量与所消耗的时间很不对等,如下图: 区区几KB的数据,简单的mapToPair操作,竟然耗时4~...
题目:MIX: Multi-Channel Information Crossing for Text Matching 腾讯出的文章 CNN做短文本匹配 1. 摘要 在En...
今年NLP 领域出现了一个比较火的模型叫SimCSE[https://arxiv.org/abs/2104.08821],文章的全称是Simple Contrastive L...
使用 python 操作 hadoop 好像只有 少量的功能,使用python 操作 hive 其实还有一个hiveserver 的一个包,不过 看这个 pyhive...
说到哈希算法,可能大部分人都会不自觉得想到 md 和 sha 系列,在这之前,我就是这样的,因为他们意味着流行安全和稳定。但是,最近我知道了一款另类的流行的哈希函数,这款哈希...
论文: 论文题目:《Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations...
今天要介绍的是一个多任务学习模型MMoE[https://dl.acm.org/doi/pdf/10.1145/3219819.3220007],如果第一次接触此类模型或是没...
转载请注明出处 http://www.jianshu.com/p/3d30070932a8作者:@贰拾贰画生 1. Monte Carlo 积分 蒙特卡洛方法的思想很简单,就...