你的位置: 首页 > 公开课首页 > 职业技能 > 课程详情

大数据处理技术-基于HadoopYarnSpark的处理及应用培训

暂无评价   
  • 课程时间:2019/05/15 09:00 至 2019/05/17 17:00 已结束
  • 开课地点:北京市
  • 授课讲师: 杨老师
  • 课程编号:386089
  • 课程分类:职业技能
你实际购买的价格
付款时最多可用0淘币抵扣0元现金
购买成功后,系统会给用户帐号返回的现金券
淘课价格¥5800
你还可以: 收藏
人气:201 收藏

课程大纲

课程详情

第一讲 云计算及大数据技术

1)云计算的概念

2)云计算发展现状

3)大数据的概念

4)大数据的应用

5)大数据关键技术

第二讲 Hadoop和Yarn介绍

1)Google中的关键技术

2)Hadoop运行架构

3)Yarn分析及介绍

4)Hadoop API分析

5)Hadoop使用和实操

第三讲 HDFS文件系统结构

1) 分布式文件系统DFS

2) HDFS体系结构介绍

3) HDFS关键运行机制

4) SequenceFile介绍

第四讲 MapReduce编程模型

1) MapReduce产生背景

2) MapReduce编程模型

3) MapReduce实现机制

4) MapReduce案例分析

第五讲Spark大数据处理技术

1)大数据处理技术

2)Spark实时处理技术

3)Spark生态系统BDAS

4)Spark架构分析

第六讲 Scala编程语言使用概述

1) Scala编程语言

2) 基本数据类型

3) 操作基本数据类型

4) 类和对象

第七讲 Spark分布式计算框架

1)Spark计算模型

2)弹性分布式数据集RDD

3)Spark的数据存储

4)Transformation算子分类及功能

5)Actions算子分类及功能

第八讲SQL On Spark

1) BDAS数据分析软件栈

2) SQL On Spark

3) Spark SQL工具使用

4) Shark工具使用

5) Hive on Spark工具

第九讲 Spark流数据处理工具Streaming

1)流数据处理工具Streaming

2) Spark Streaming架构

3) Spark Streaming原理

4) Spark Streaming实例

第十讲Spark中的大数据挖掘工具MLlib

1)大数据挖掘工具MLlib

2)MLlib的数据存储

3)MLlib中的聚类和分类

4)MLlib算法应用实例

5)利用MLlib进行推荐

第十一讲 Spark大规模图处理工具GraphX

1)大规模图处理工具GraphX

2)GraphX的运行架构

3)GraphX操作使用

4)GraphX使用实例



讲师介绍

杨老师,资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。


本课程名称: 大数据处理技术-基于HadoopYarnSpark的处理及应用培训

查看更多:职业技能公开课

供应链 相关的最新课程
讲师动态评分 与同行相比

授课内容与课纲相符00%

讲师授课水平00%

服务态度00%