时间序列预测话题是比较早期接触的算法应用。 01 背景前言 时间序列分析之holtwinters和ARIMA中提到: 由于良好的统计特性,ARIMA模型是应用最广泛的时间序列...
时间序列预测话题是比较早期接触的算法应用。 01 背景前言 时间序列分析之holtwinters和ARIMA中提到: 由于良好的统计特性,ARIMA模型是应用最广泛的时间序列...
集成学习Ensemble Learning 集成学习是一种思想而不是一种算法,通过合并多个弱学习器(决策树、神经网络、朴素贝叶斯等)来提升机器学习的性能。目前集成学习方法大致...
1、深度学习发展史 大致经历两次浪潮:浅层学习,深度学习 Geoffrey Hinton 神经网络之父 AlexNet 2012年在ILSVRC比赛中脱颖而出,进入深度学习爆...
自2012年,AlexNet在ImageNet图像识别一战成名后,基于深度学习的图像识别快速发展。 图像识别也是深度学习研究的主要领域。 本文解释在机器角度,图片的存在形式,...
在学习器训练过程中经常会遇到过拟合的情况,模型记录噪声和不相关特征,在新数据面前训练效果不佳。这样的学习器没有从训练数据中学习真正有意义的模式,而只是记录了它所看到的一切,解...
一、前言 1、大数据业务搭建[3] 在这个大数据时代,一个公司大数据业务搭建的过程大致如下:首先,是数据基础和需求,这个公司得是一个能接触到大量数据的公司。第二,是大数据平台...
性能度量是指模型泛化能力的衡量,泛化能力可以理解为对于未知数据的预判能力 1、回归场景 (1)均方误差MSE 回归预测最常用的性能度量是“均方误差”(MSE mean squ...
一、简介 1、社区 社区是一个子图,包含顶点和边,同一社区内结点与结点之间的连接很紧密,而社区与社区之间的连接比较稀疏。 2、louvain与Modularity Louva...
hive是基于Hadoop的一个数据仓库工具,提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据。 一、HIVE基础概念与操作 1、Hive 内部表和外...