人工智能、机器学习、深度学习、数据挖掘概述、学习攻略

📖 综述

本质上,“机器学习”“数据科学”“人工智能”都是一些概念,本质都是以数据为基础,结合计算机系统进行分析。

【概述】:以上四者的区别主要是要达成的目的不同,但达到目的的方法有很大重叠之处,比如【SVM,神经网络,Logistic回归,决策树、EM、HMM、贝叶斯网络、随机森林、LDA...】等算法在各个领域都有所使用。

【背景】:人类现在已经处于人工智能时代,正处于计算机科学时代、统计时代、个性化服务和数据时代,或者手机、移动互联网时代。

📖 方向

  • 💬数据挖掘是用来 理解事物 的;

  • 💬机器学习是用来 预测事物 的;

  • 💬人工智能是用来 生成行动 的;

【图解】

📖 【人工智能】(Artificial Intelligence)

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

【通俗理解💬】:要让机器的行为看起来能够像人表现出来的行为那样,“有智慧”。

【本质上💬】:数据模型为现有的问题提供解决方法。


📖【机器学习】(Machine Learning)

【百度百科💬】:机器学习( ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

【补充💬】:M代表计算机程序(Computer Program),对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E学习。

【本质上的理解💬】:机器学习就是能够自动地从过往经验中学习知识,其主要功能是预测

【地位】:它是人工智能的核心,是使计算机具有智能的根本途径。

其他解读方式
  • 机器学习应用在数据分析领域 = 数据挖掘

  • 将机器学习应用在图像处理领域 = 计算机视觉

  • 将机器学习应用在人脸识别领域 = 生物特征识别

  • 机器学习是解决人工智能问题的一种手段

【应用💬】:数据挖掘、计算机视觉、自然语言处理、生物特征识别、语音、手写识别和机器人运用等。

功能描述 【机器学习】第三方库 官网
数据分析包 Pandas https://www.pypandas.cn/
科学计算的核心包 Scipy https://www.scipy.org/
机器学习函数库 Scikit-learn https://sklearn.apachecn.org/
统计建模工具包 StatsModels https://pypi.org/project/statsmodels/0.4.3/
深度学习框架 TensorFlow https://tensorflow.google.cn/

📖 深度学习(DL)

【概述💬】深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。

  • 【深度学习本身是神经网络算法的衍生】
  • 【区别💬】:深度学习不全部包含于机器学习;但是全部包含于神经网络算法

【发展历史💬】:最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。
【遇到的难题💬】:由于训练数据量不足、计算能力落后,因此最终的效果不尽如人意。
【应用💬】:无人驾驶汽车,预防性医疗保健;

【有待提升的地方】

  1. 深度学习模型 需要大量的【训练数据】,才能展现出神奇的效果,但现实生活中往往会遇到小样本问题(没有足够多的数据),此时深度学习方法无法入手,传统的机器学习方法就可以处理;

  2. 有些领域,采用传统的简单的机器学习方法,可以很好地解决问题,没必要非得用 复杂的深度学习方法

  3. 深度学习的思想,来源于人脑的启发,但不是人脑的模拟,区别在于人脑不需要大量的数据训练支持,我们只要看过一张猫的图就认识了猫,而机器必须经过几百万张猫的图才能“认识”猫。(识别有待提高)。


📖 【数据挖掘】

数据挖掘(Data mining)

又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。

利用各种技术与统计方法,将大量的历史数据,进行整理分析,归纳与整合,是从海量数据中“挖掘”隐藏信息,如趋势、特征及相关的一种过程。

【服务💬】:有目的的从现有的信息中提取数据的模式和模型,以用于未来机器学习和人工智能的数据使用。其核心目的是找到数据变量之间的关系

【举个栗子💬】:A 和 B 可能存在相关关系,但是它无法告诉你 A 和 B 存在什么相关关系,由此,我们通过数据挖掘去寻找关系。

【应用💬】:商业智能、数据分析、市场运营等。

【重点💬】:

  • 【数据挖掘不是一种用来证明假说的方法,而是用来构建各种各样的假说的方法。】

  • 【统计学、数据库和人工智能共同构造了数据挖掘技术的三大支柱】

  • 【数据挖掘的很多算法也来自机器学习但两者没有从属关系】:把数据挖掘理解为一种类型的工作(机器学习是帮助完成这个工作)


📖 图解
图解【人工智能】

【图片来源】:https://blog.csdn.net/luanpeng825485697/article/details/78769184

【参考】:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342