你的位置: 首页 > 公开课首页 > 语言 > 课程详情
课程介绍 评价详情(0)
本课程名称: Python网络爬虫及数据采集技术培训
查看更多:语言公开课
我要找内训供应商
授课内容与课纲相符0低0%
讲师授课水平0低0%
服务态度0低0%
课程介绍 评价详情(0)
培训受众:
课程大纲
1.什么是网络爬虫
2.浏览网页的过程
3.URL的含义
4. 环境的配置
第二讲 Python爬虫基础知识
1.Python爬虫基础学习
2.Python urllib和urllib2 库的用法
3.Python 正则表达式
4.BeautifulSoup简介
5.爬虫框架Scrapy
第三讲 Urllib库的基本使用
1.网页爬取示例
2.网页爬取方法
3.构造Requset
4.POST和GET数据传送
第四讲 Urllib库的高级用法
1.设置Headers
2. Proxy(代理)的设置
3.Timeout 设置
4.HTTP的PUT和DELETE方法
5.使用DebugLog
第五讲 正则表达式
1.了解正则表达式
2.正则表达式的语法规则
3.正则表达式相关注解
4.Python Re模块
第六讲 Beautiful Soup的用法
1. Beautiful Soup的简介
2. Beautiful Soup 安装
3. 创建 Beautiful Soup 对象
4. Beautiful Soup对象种类
5. 遍历文档树
第七讲 开始采集
1.遍历单个域名
2.采集整个网站
3.通过互联网采集
4.用Scrapy采集
5.几个示例
第八讲 存储数据和读取文档
1.媒体文件
2.把数据存储到CSV
3.MySQL与Python整合
4.读取纯文本和CSV文档
5.读取Word和.docx
第九讲 自然语言处理基础
1.概括数据
2.马尔可夫模型
3.自然语言工具包
4.用NLTK做统计分析
5.用NLTK做词性分析
第十讲 用爬虫测试网站
1.测试简介
2.Python单元测试
3.Selenium单元测试
4.Python单元测试与Selenium单元测试的选择
培训师介绍
主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。
本课程名称: Python网络爬虫及数据采集技术培训
查看更多:语言公开课