你的位置: 首页 > 公开课首页 > 项目管理 > 课程详情

details

Hadoop大数据分析最佳实践课程

主打课程
暂无评价   
  • 开课时间:2016/06/18 09:00 已结束
  • 结束时间:2016/06/19 17:00
  • 开课地点:广州市
  • 授课讲师: cheng
  • 课程编号:313929
  • 课程分类:项目管理
  •  
  • 收藏 人气:856
你实际购买的价格
付款时最多可用0淘币抵扣0元现金
购买成功后,系统会给用户帐号返回的现金券
淘课价格
1880
你还可以: 收藏

培训受众:

熟悉Hadoop分布式文件系统
懂得hdfs分布式文件系统的使用
了解MapReduce工作原理
熟知Hadoop集群硬件配置规划
懂得Hadoop集群配置及优化
学会如何维护和监测Hadoop集群
学会怎么使用Sqoop连接关系数据库进行数据导入导出
了解Hive数据仓库的开发和应用
Hue的web页面的数据库开发
精通H列式数据库的开发
掌握大数据挖掘分析基础
了解数据挖掘常见的几种工具和对比
了解几种常用的挖掘算法原理
了解大公司对大数据的应用场景和未来方向

课程收益:

熟悉Hadoop分布式文件系统
懂得hdfs分布式文件系统的使用
了解MapReduce工作原理
熟知Hadoop集群硬件配置规划
懂得Hadoop集群配置及优化
学会如何维护和监测Hadoop集群
学会怎么使用Sqoop连接关系数据库进行数据导入导出
了解Hive数据仓库的开发和应用
Hue的web页面的数据库开发
精通H列式数据库的开发
掌握大数据挖掘分析基础
了解数据挖掘常见的几种工具和对比
了解几种常用的挖掘算法原理
了解大公司对大数据的应用场景和未来方向

培训颁发证书:

颁发证书:工信部《大数据技术》初级证书。
颁发工信部通信行业职业技能鉴定指导中心颁发的《大数据技术》初级专项技术培训证书(证书费用:200元/人)

课程大纲

培训大纲:

第一天:
第一部分:如何构建分布式数据仓库平台
1.怎么样才算是真正意义的大数据平台
2.开源Hadoop生态系统的介绍
3.数据采集过程与分布式存储
1)ETL原理
2)Sqoop
3)HDFS
4.数据仓库与数据分析介绍
1)MapReduce
2)Hive
3)Pig
4)H
5)Impala
5.集群监控与调度组件
1)Hadoop集群权限管理
2)H列数据库监控
3)Hive集群监控
4)Oozie介绍
6.Hue介绍和例子讲解
7.日志收集工具
1)flume
2)kafka
8.练习
9.案例讲解
1)运营商全国用户上网记录案例介绍
2)IBM网上舆情分析

第二天:
第二部分:大数据平台部署及案例
1.我们应该选哪种Hadoop?
1)选哪个版本?为什么?
2)优点和缺点
2.集群硬件应该如何选配?
1)网络拓扑
2)内存
3)硬盘
4)CPU
5)价格
3.部署案例讲解
1)英特尔Hadoop发行版详解
2)某省级通信运营商清帐单查询系统介绍

第三部分:H列数据库及应用案例
1.H感性认识
1)H简介
2)H特点
3)H与RDBMS对比
4)H体系结构
5)H常见概念
2.H主要组成
1) H基本命令介绍
2) Zookeeper、Hmaster
3) HRegionServer、Region
4) HStore存储、Hfile
5) H内部扫描RowKey的原理
6) H内部读写原理
7) H设计原理、架构分析
8) Hadoop H伸缩性(自动扩容、热部署)
9) H相关表结构设计(列族、列详细分析)
10) H主HMaster与备用HMaster间的切换原理
3.H性能测试
1) 测试数据
2) 测试过程
3) 测试结论
4) 和Oracle Rac等进行对比
4.H设计原则和优化
1) H的RowKey设计原则
2) 性能参数的设置
3) 性能参数的调整
4) 模型和性能优化
5.练习
6.项目案例:
1) H在小米业务的应用

第三天:
第四部分:大数据挖掘介绍
1.大数据挖掘几种方法
1)传统数据挖掘
2)SPSS_Modeler14.2
3)SAS简介
4)Mahout简介
5)R语言详解
6)Rhadoop\\Rhive
2.算法介绍和应用
1)关联分析
2)K-Means
3)决策树C5.0
4)Logistic回归
5)主成分/因子分析
6)Apriori算法
7)预测算法
8)神经网络
9)协同过滤挖掘算法
3.例子和练习

第五部分:大数据挖掘应用案例详解
1.项目案例详解
1)TF-IDF与余弦相似性的应用
2)电力行业的大数据应用
2.大数据在电信行业应用
1)用户行为编好分析
2)电信客户流失预测分析
3.大数据在零售行业应用
1)销售产品关联分析
2)营销产品推荐系统
3)门店客流量预测案例


五、联系方式

咨询热线:400-070-7620

培训师介绍

陈老师:九年相关项目经历,长期从事大数据相关的工作,精通大数据技术,熟悉关系型数据库oracle10G\\Mysql等;精通H、HDFS、Hive、Pig等开源技术,对实时处理Storm、Impala有较深的认识,熟悉分布式计算MapReduce。非常精通数据挖掘算法和解决方案,比如决策树、K-means、预测分析、Logistc线性回归、Apriori算法应用熟悉电信、移动、电力、证券、网络、物流等业务。

本课程名称: Hadoop大数据分析最佳实践课程

查看更多:项目管理公开课

数据分析 数据库 ie 设计 大数据分析 相关的最新课程
讲师动态评分 与同行相比

授课内容与课纲相符00%

讲师授课水平00%

服务态度00%