你的位置: 首页 > 公开课首页 > 生产管理 > 课程详情
课程介绍 评价详情(0)
本课程名称: 大数据分析挖掘:基于HadoopMahoutMLlib的大数据挖掘培训
查看更多:生产管理公开课
我要找内训供应商
授课内容与课纲相符0低0%
讲师授课水平0低0%
服务态度0低0%
课程介绍 评价详情(0)
培训受众:
_x000D_
1,系统架构师、系统分析师、高级程序员、资深开发人员。
_x000D_
2,牵涉到大数据处理的数据中心运行、规划、设计负责人。
_x000D_
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
_x000D_
4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。
_x000D_
课程大纲
第一讲大数据挖掘及其背景
1)数据挖掘定义
2)Hadoop相关技术
3)大数据挖掘知识点
第二讲 MapReduceDAG计算模式
1)分布式文件系统DFS
2)MapReduce计算模型介绍
3)使用MR进行算法设计
4)DAG及其算法设计
第三讲 云挖掘工具MahoutMLib
1)Hadoop中的Mahoutb介绍
2)Spark中的MahoutMLib介绍
3)推荐系统及其Mahout实现方法
4)信息聚类及其MLlib实现方法
5)分类技术在MahoutMLib中的实现方法
第四讲 推荐系统及其应用开发
1)一个推荐系统的模型
2)基于内容的推荐
3)协同过滤
4)基于Mahout的电影推荐案例
第五讲 分类技术及其应用
1)分类的定义
2)分类主要算法
3)Mahout分类过程
4)评估指标以及评测
5)贝叶斯算法新闻分类实例
第六讲 聚类技术及其应用
1)聚类的定义
2)聚类的主要算法
3)K-Means、Canopy及其应用示例
4)Fuzzy K-Means、Dirichlet及其应用示例
5)基于MLlib的新闻聚类实例
第七讲 关联规则和相似项发现
1)购物篮模型
2)Apriori算法
3)抄袭文档发现
4)近邻搜索的应用
第八讲 流数据挖掘相关技术
1)流数据挖掘及分析
2)Storm和流数据处理模型
3)流处理中的数据抽样
4)流过滤和Bloom filter
第九讲 云环境下大数据挖掘应用
1)与HadoopYarn集群应用的协作
2)与Docker等其它云工具配合
3)大数据挖掘行业应用展望
培训师介绍
本课程名称: 大数据分析挖掘:基于HadoopMahoutMLlib的大数据挖掘培训
查看更多:生产管理公开课