之前我对大数据不理解。
- 大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据要解决什么问题?
-
数据分析的前提是有数据,数据存储的目的是支撑数据分析。究竟怎么去存储庞大的数据量,是开展数据分析的企业在当下面临的一个问题。传统的数据存储模式存储容量是有大小限制或空间局限限制的,怎么去设计出一个可以支撑大量数据的存储方案是开展数据分析的首要前提。
当解决了海量数据的存储问题,接下来面临的海量数据的计算问题也是比较让人头疼,因为企业不仅追求可以计算,还会追求计算的速度、效率。
以目前的互联网行业产生的数据级别,要处理这些数据,就需要一个更好、更便捷的分析计算方式了。传统的显然力不从心了,而且效率也会非常低下。这正是传统数据分析领域面临的另一个挑战,如何让去分析、计算。这个时候就需要有新的技术去解决这些问题,这个技术就是大数据。
大数据主要解决的问题:海量数据的存储和海量数据的计算问题。
大数据的特点
- 大:数据体量巨大;
- 多:种类(结构化、半结构化、非结构化等)和来源(网络日志、音视频、图片等)多。
- 值:大数据价值密度相对较度,需要通过强大的机器算法迅速完成数据的价值提炼。
- 快:增长速度快、处理速度快、获取速度也要快。
- 信:数据的准确性和可信赖度。
大数据的应用场景
- 电商方面:如精准广告位等
- 传媒方面:如根据受众喜好进行交互推荐等
- 金融领域:如根据个人不同情况推荐投资理财产品等;
- 交通方面:如预测车流量情况、合理道路规划、即时信号灯调度等;
- 电信方面:如对用户的行为习惯、偏好相应数据变化,调节自身业务结构等;
- 安防方面:如人脸识别等;
- 医疗方面:如智慧医疗等;