自然语言处理领域主要5中处理技术或处理模型
分别是:分类、匹配、翻译、结构预测、马尔科夫决策过程。
这五种处理技术分别可以实现的功能是:
分配:文本分类、情感分类;
匹配:搜索、问题回答、对话(主要是单轮对话);
翻译:机器翻译,语音识别,手写识别,单轮对话;
结构预测:专门识别,词性标注,句法分析,文本的语义分析,知识图谱构建;
马可夫决策过程:多轮对话。
分类:
文本分类:色情新闻分类、商品自动分类、法律卷宗分类、广告信息分类。
代表公司:达观数据
体验1:法狗狗(搜索公众号即可,tab1→智能咨询→劳动机器人)
体验2:胜利油田中心医院(搜索公众号,tab1→导诊→智能导诊)
情感分类:暂未找到应用此功能独立公司,应用于聊天机器人中。
匹配:
搜索:(作为某种功能集合在其他产品中,暂未发现单独使用的公司)
问题回答:智能客服,语音助理。代表公司,出门问问,智齿客服
体验:出门问问APP,翼龙贷微信公众号客服系统,(直接开始对话即可)
单轮对话:陪伴机器人,个人助手,聊天机器人。体验:出门问问siri
翻译:
机器翻译:Google翻译,体验:Google翻译APP
语音识别:代表,科大讯飞,普强信息,体验:讯飞语音输入法
手写识别:代表公司,汉王
单轮对话:执行单论对话,且执行某些人为设定的操作指令。代表,siri,智能家居,行车语音助手等。
结构预测:
专门识别:(技术应用于翻译、知识图谱构建、对话、文本分类中)
词性标注:(技术应用于翻译、知识图谱构建、对话、文本分类中)
语法分析:(技术应用于翻译、知识图谱构建、对话、文本分类中)
文本的语义分析:(技术应用于翻译、知识图谱构建、对话、文本分类中)
知识图谱构建:构建知识图谱,代表:理脉智能
马可夫决策过程:
多轮对话:能够理解代表:Amazon echo Google Assistant Google Home。
创业方向分析:
大体说有三类。
一类是指令式的,比如智能家居,你下达指令,让它开灯关灯;车载环境下也是指令类。
第二类是QA类的,基本应用在客服上。##注意事项:大企业会自己做客服系统,借助自身大量的客户积累,去实现问题和回答的匹配。当然有一些中小企业和传统企业,没有这个能力,所以有一些创业公司就切进去了。##注意事项:多轮对话难度非常大。
第三类:是利用NLP技术对以前积累的数据和知识进行分析和处理,比如文本构成的知识库,像卷宗、病历等等,用Watson这样的系统去分析它,尝试发掘一些规则的知识。
##注意事项:通用知识图谱无用户场景,通讯类知识图谱华为等巨头在做。
企业要求:开始有一个系统,然后有用户产生大量的数据,之后基于数据,开发好的算法,提高系统的性能。如果能够闭环跑起来,就可以去收集更多的数据,可以开发出更好的机器学习算法,使得人工智能系统的性能能够不断提升。这个人工智能闭环是现代人工智能技术范式里最本质的一个现象,对于自然语言处理也不是例外。
附:当前阶段各项功能准确率