姓名:王正帅
学号:14020120007
【嵌牛导读】:模式识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。其中包括聚类分析、判别域代数界面方程法、统计判决、学习训练与错误率估计、最近邻方法、特征提取和选择等几个重要内容,现只对模式识别的聚类分析和判别域代数界面方程法这两个方面进行综述。
【嵌牛鼻子】:模式识别、聚类分析、判别域代数界面方程法
【嵌牛提问】:模式识别有何用处?聚类分析和判别域代数界面方程法可以实现哪些功能?
【嵌牛正文】:
1、聚类分析
1.1聚类分析的概念
定义:聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为
基本思想:相似的归为一类、模式相似性的度量和聚类算法、无监督分类
特征量的类型:物理量(重量、长度、速度)、次序量(等级、技能、学识)、名义量(性别、状态、种类)
方法的有效性:取决于分类算法和特征点分布情况的匹配
聚类遵循的基本步骤:特征选择、近邻测度、聚类准则、聚类算法、结果验证、结果判定
聚类应用的四个基本方向:减少数据、假说生成、假说检验、基于分组的预测
1.2 模式相似性测度
距离测度:距离测度的测度基础为两个矢量矢端的距离,测度数值为两矢量各相应分量之差的函数。
相似测度
匹配测度
1.3 类间距离测度方法:最近距离法、最远距离法、中间距离法、重心距离法、平均距离法、离差平方和法
1.4 聚类的算法
聚类的技术方案
聚类分析有很多具体的算法,有的比较简单,有的相对复杂和完善,但归纳起来就是三大类:
按最小距离原则简单聚类方法
按最小距离原则进行两类合并的方法
依据准则函数动态聚类方法
2. 判别域代数界面方程法
用判别域界面方程分类的概念:
线性可分的定义
对于来自两类的一组模式,如果能用一个线性判别函数正确分类,则称他们是线性可分的。
分类方法的基本技术思路
第一步:利用训练样本求出分类器/判别函数
第二步:利用判别函数对未知类别样本分类
有以下几个方面:线性判别函数、Fisher线性判别
模式识别在人工智能、机器视觉方面将有很大的应用,未来还有很多探索研究的地方。
2、成立达摩院的初衷
如果说科学的宗旨是发现规律,而技术和工程是利用、应用规律,那么,在通过技术工程利用技术的同时,阿里希望去掌握、发现规律—这,可以理解为阿里巴巴建设达摩院的初心。当今阿里拥有雄厚的资金、广阔的市场和丰富的数据资源,如果把这些充分利用综合起来肯定能使自己的科技更加创新,其转换的科技价值和商业价值会更大,能更加普惠世界人民。
3、达摩院为何为阿里存活的时间长
马云曾说:“达摩院要活得比阿里巴巴长,阿里巴巴要走102年很艰难,任何一家公司的生命都是有限的,要给人类留下一个研究院。商业智慧要留下来,所以建立湖畔大学,还有公益基金会,这三个都要活得比阿里巴巴长。”任何一家公司都有生命周期,阿里也不例外。但是作为研究机构定位的达摩院却是阿里留下来的科技财富。
4、达摩院的效果和影响
达摩院所涉及的研究领域几乎都可以看到未来五到十年之后的商业前景。马云预期达摩院要服务全世界至少20亿人口,在2036年参与打造世界第五大经济体,阿里巴巴影响力现在等于世界第21个经济体。要解决世界经济未来的问题。从其站位和发展模式来看,未来必定会给人们留下宝贵的科研财富。