你的位置: 首页 > 公开课首页 > 职业技能 > 课程详情
课程介绍 评价详情(0)
讲师介绍 杨老师,资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。
本课程名称: 大数据处理技术-基于HadoopYarnSpark的处理及应用培训
查看更多:职业技能公开课
我要找内训供应商
授课内容与课纲相符0低0%
讲师授课水平0低0%
服务态度0低0%
课程介绍 评价详情(0)
课程大纲
第一讲 云计算及大数据技术
1)云计算的概念
2)云计算发展现状
3)大数据的概念
4)大数据的应用
5)大数据关键技术
第二讲 Hadoop和Yarn介绍
1)Google中的关键技术
2)Hadoop运行架构
3)Yarn分析及介绍
4)Hadoop API分析
5)Hadoop使用和实操
第三讲 HDFS文件系统结构
1) 分布式文件系统DFS
2) HDFS体系结构介绍
3) HDFS关键运行机制
4) SequenceFile介绍
第四讲 MapReduce编程模型
1) MapReduce产生背景
2) MapReduce编程模型
3) MapReduce实现机制
4) MapReduce案例分析
第五讲Spark大数据处理技术
1)大数据处理技术
2)Spark实时处理技术
3)Spark生态系统BDAS
4)Spark架构分析
第六讲 Scala编程语言使用概述
1) Scala编程语言
2) 基本数据类型
3) 操作基本数据类型
4) 类和对象
第七讲 Spark分布式计算框架
1)Spark计算模型
2)弹性分布式数据集RDD
3)Spark的数据存储
4)Transformation算子分类及功能
5)Actions算子分类及功能
第八讲SQL On Spark
1) BDAS数据分析软件栈
2) SQL On Spark
3) Spark SQL工具使用
4) Shark工具使用
5) Hive on Spark工具
第九讲 Spark流数据处理工具Streaming
1)流数据处理工具Streaming
2) Spark Streaming架构
3) Spark Streaming原理
4) Spark Streaming实例
第十讲Spark中的大数据挖掘工具MLlib
1)大数据挖掘工具MLlib
2)MLlib的数据存储
3)MLlib中的聚类和分类
4)MLlib算法应用实例
5)利用MLlib进行推荐
第十一讲 Spark大规模图处理工具GraphX
1)大规模图处理工具GraphX
2)GraphX的运行架构
3)GraphX操作使用
4)GraphX使用实例
讲师介绍
杨老师,资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。
本课程名称: 大数据处理技术-基于HadoopYarnSpark的处理及应用培训
查看更多:职业技能公开课