文本相似性的应用场景会有很多,在工业界我粗略遇到过: 热点做舆情识别监控的时候,需要对全网文章进行聚合,聚合过程中需要知道哪些文章是一致的 推荐...
前言 在自然语言处理领域,我们有一种类型的问题是如何在一堆文本中提取出核心词/句子。而无论是对于长文本还是短文本,往往几个关键词就可以代表整个文...
更多来自于GitHub:Reflection_Summary. Bert的双向体现在什么地方? mask+attention,mask的word...
本文主要是为了讲解xDeepFM的框架,及如何用tensorflow去实现主干部分,如果需要直接拆箱可用,可以参考:xDeepFM,我的部分代码...
前言 最近在看AutoML,业界在 automl 上的进展还是很不错的,个人比较看好这个方向,所以做了一些了解: Google: Cloud A...
本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。 另外,欢迎大...
本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。 另外,欢迎大...
我们搞了个python的工具包PyTls。 做这件事的初衷是发生了一个星期要用python同时开发3个项目的情况,我发现了两个现象:1.有很多定...
上个月由于业务需要定制化了一个中文语境下的手机号码识别库YMMNlpUtils DEMO解析 Github地址 现在由于业务需求,又新增了一个语...