1.Docker
Docker是一种虚拟技术,和VMware类似,装过VM虚拟机的同学应该比较清楚。相同配置的主机上,最多装4个VM虚拟机的情况下,可以装10台Docker虚拟机。
2.什么是Hadoop,Hbase和Hive
Hadoop是一个类似oracle的数据库软件
Hbase基于Hadoop的关系型数据库
Hive是基于Hadoop的数据仓库和SQL查询引擎,有特殊的查询语句:Hql
3.云游戏
云游戏属于云计算的一种,意味着以后玩游戏不需要购买高端机,云服务器会直接渲染好,将数据传输到客户端,简直是屌丝福利。
4.云计算架构图
5.一句话解释大数据
大数据指的是,从过去的对随机抽样进行数据挖掘,数据分析等转变为对全部数据的数据挖掘,数据分析,数据可视化等操作。重要的事说三遍:全部数据,全部数据,全部数据!
6.大数据的四个特点
Volumn 海量 Velocity 快速 Variety 多样 Veracity 真实
其中海量对应知识点5中的一句话解释大数据。
7.云计算,大数据和Hadoop的关系
云计算相当于容器,大数据则是容器中的水,云计算为大数据提供存储和计算,这些水的来源则是Hadoop。
存放了海量数据的Hadoop安装在Docker上,Docker相当于云计算服务器,可以与Hadoop进行数据间的存储和计算,然后Hadoop通过Tomcat等服务器软件和网站或者应用实现数据交互。
8.Hadoop
命名是一个工程师儿子玩具的名字,并不是专业名词缩写。
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
Hdaoop的核心设计是:HDFS(存储)和MapReduce(计算)。
HDFS是Hadoop Distributed File System的缩写,意思是Hadoop分布式文件系统。
Hadoop可以部署在普通PC机上,Hadoop时由Java编写的框架。
9.HDFS组件
采用流式数据访问形式。
什么是流式数据访问?
HDFS两种集群节点:名称节点NameNode和数据节点DataNode。
NameNode在内容中保存文件数据块映射的映像信息和整个文件系统的命名空间。
DataNode负责存储和读取数据文件。
10.MapReduce组件
11.Hadoop版本选择及如何学习
Hadoop1.0和Hadoop2.0
Hadoop版本选择:
是否为开源软件,是否免费。
是否有稳定版,一般软件官方网站会给出说明。
是否经实践验证,这个可以通过是否有大点的公司在生产环境中应用。
是否有强有力的社区支持,社区的力量是无限大的。
学习资料出自天善智能的牟瑞老师Hadoop入门课:https://edu.hellobi.com/course/39/lessons
>期待和大家交流,共同进步,欢迎大家加入我创建的与前端开发密切相关的技术讨论小组:
> - SegmentFault技术圈:[ES新规范语法糖](https://segmentfault.com/g/1570000010695363)
> - SegmentFault专栏:[趁你还年轻,做个优秀的前端工程师](https://segmentfault.com/blog/chennihainianqing)
>- 知乎专栏:[趁你还年轻,做个优秀的前端工程师](https://zhuanlan.zhihu.com/wyasy)
>- Github博客: [趁你还年轻233的个人博客](https://github.com/FrankKai/FrankKai.github.io)
>- 前端开发QQ群:660634678
>- 微信公众号: 人兽鬼 / excellent_developers
![](https://upload-images.jianshu.io/upload_images/2976869-157e8624bcdfd62a.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
>努力成为优秀前端工程师!