监督学习 KNN K-近邻算法是一个分类模型,原理是:存在一个已经标注好的训练集合,数据结构是特征集+label;我们通过比较未标注数据与已标注数据的特征之间的相似关系,取前...
监督学习 KNN K-近邻算法是一个分类模型,原理是:存在一个已经标注好的训练集合,数据结构是特征集+label;我们通过比较未标注数据与已标注数据的特征之间的相似关系,取前...
从目标去衡量-定义理想态 对于任何需求来讲,我们都会有一个需求目标,解决什么问题;对于功能性场景来说,我们的目标就是用户使用流程/感知没有就是完成基本任务;但是对于推荐这种策...
业务架构 由前文可以看出,推荐系统的本质就是拟合一个用户满意度的函数y=(Xi,Xu,Xc) 函数结果受主要受内容Xi、用户Xu、上下文Xc三个维度的影响因子影响;一般还会外...
推荐系统的目标 信息爆炸的产品中,通过推荐系统帮助用户从大量信息中筛选出用户最可能感兴趣的; 从场景上分析,推荐实际上对用户来说大多是被动的,需求并不清晰。用户的心理决策如下...
应用背景 目前在对话机器人领域,开放域的闲聊型对话技术不成熟,基本算是”人工智障“; 而在封闭域,单纯的任务型对话脱离场景落地困难,难以取代GUI当前的地位,基本算是”可以用...
当前闲聊机器人有两种实现方式:基于检索 与 基于生成 基于检索的chatbot 检索这种方式,在搜索与推荐系统中通常会用的到。具体来说是衡量一种相似度; 在人机对话的开放域,...
什么是基于数据驱动 前面有说过基于目标/任务/流程驱动的DM系统,这些方法其实都属于手动设计特征,复杂的对话逻辑是由人来设计处理逻辑去完成的。这样的方法在小范围内其实表现会更...
以目标为中心的DM 对于任务型对话来讲,我们如果想要进行复杂的对话管理,首先要进行复杂场景的抽象。什么是对话过程中一直不变的?流程不是,虽然它能快速解决问题对话有顺序,但不必...
NLU定义 自然语言理解(NLU)就是要获得一个计算机能用来计算的语义框架文字本身就是人类用来承载语义的工具,语义框架就是对其含义的抽象,语言的表示是多样的,但是背后的语义是...
声纹识别 原理 任何两个人的声纹图谱都有所差异,通过检测相同音素的声纹特征就可以判断出是否同一个人。因此声纹也是作为生物识别的手段之一。其识别流程类似于人脸识别,输入经过模型...
什么是BERT BERT是谷歌最新提出的语言模型,在处理NLP的各项任务上,这个通用模型基本完爆所有模型。可以说是未来NLP的领军人物了。这个是谷歌在超大规模的语料上训练出的...
什么是GAN 这两年来,GAN生成对抗网络非常火,时不时的有新奇应用爆出来。比如机器创作名画、二次元头像,还有生成非常美的摄影作品,甚至在某些网站出现AI换脸的骚操作。 实际...
RNN是什么 RNN即序列神经网络,通常用来处理人类语言、音乐等具有序列属性的任务 人类语言本身作为一种符号并没有意义,只不过是人类对其赋予了意义。而这种意义体现在每个字(语...
CNN是啥 CNN即卷积神经网络,通常用来处理计算机视觉方面的任务 虽然之前介绍过通用神经网络,但是为什么还要用CNN来处理图像呢? 因为通用结构在在处理很多任务上缺乏’技巧...