Spark 及 Hadoop开发员培训将学习如何将数据导入到 Apache Hadoop 机群并使用 Spark、Hive、Flume、Sqoop、Impala 及其他 Hadoop 生态系统工具对数据进行各种操作和处理分析。Spark 及 Hadoop 开发员培训将于2017-03-16召开,期间活动家将为您带来更多的Spark 及 Hadoop 开发员培训资讯和最安全的报名通道:
https://www.huodongjia.com/event-661863863.html
培训概况
在为期四天的培训中,学员将学习关键概念和掌握使用最新技术和工具将数据采集到 Hadoop 机群并进行处理。通过学习掌握诸如 Spark、Hive、Flume、Sqoop 和 Impala 这样的 Hadoop 生态系统工具和技术,Hadoop 开发员将具备解决实际大数据问题和挑战的能力。本课程包含了大量的实操及编程练习来帮助学员熟悉并掌握各种工具,并最终获得在实际工作中针对特定的问题或场景来选取最佳解决工具或技术的能力。
培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将学习 Apache Spark 及如何将其集成到整个 Hadoop 生态系统中去,包括以下内容:
数据是如何在 Hadoop 机群里进行分布式存储及处理的
如何使用 Sqoop 和 Flume 导入数据
如何使用 Apache Spark 处理分布式数据
如何使用 Impala 及 Hive 将结构化数据建模成表并进行分析查询
如何根据数据使用场景来确定最佳存储格式
数据存储最佳实践
培训对象及学员基础
本课程适合准备报考 CCA Spark 及 Hadoop 开发员认证考试的技术人员。虽然通过该认证考试,考生仍然需要做进一步的学习和准备,但是本课程涵盖了在该认证考试中考核的很多主题和知识点。
在参加完本培训后,我们建议学员参加此课程的一个后继课程:“设计和创建大数据应用”
课程介绍
Hadoop 及生态系统介绍
传统大规模系统的问题
Hadoop !
Hadoop 生态系统
Hadoop 体系结构及 HDFS
机群环境下的分布式处理
存储:HDFS 体系结构
存储:使用 HDFS
资源管理:YARN 体系结构
资源管理:使用 YARN
使用 Apache Sqoop 导入关系数据
Sqoop 简介
数据的基本导入导出
减少传输的数据量
改善 Sqoop 性能
Sqoop 2
……
为了简化报名流程,Spark 及 Hadoop 开发员培训已开通网上购票系统,您可登陆活动家网站进行峰会报名!
快捷报名地址:https://www.huodongjia.com/event-661863863.html