python网络爬虫、文本挖掘与数据可视化培训班2019(8月贵阳班)
时间:2019-08-03 09:00 至 2019-08-06 12:00
地点:贵阳
- 参会报名
- 会议通知
- 会议日程
- 会议嘉宾
- 参会指南
-
手机下单
python网络爬虫、文本挖掘与数据可视化培训班2019(8月贵阳班) 已截止报名会议时间: 2019-08-03 09:00至 2019-08-06 12:00结束 会议地点: 贵阳 元和世纪酒店 贵州省贵阳市南明区解放路184号元和国际1层 周边酒店预订 会议规模:35人 主办单位: 中国通信工业协会(CCIA)
|
会议通知
会议内容 主办方介绍
python网络爬虫、文本挖掘与数据可视化培训班2019(8月贵阳班)宣传图
一,课程目标与特点
1、培训采用理论知识+案例示范+代码练习的workshop项目化教学模式,所有课程将围绕实战案例展开,通过典型案例入手讲解知识点,让学员系统掌握Python语言的基本结构、语法与数据类型,模块,熟悉函数、类设计、包的使用及基本的编程方法;掌握网络信息获取及文本挖掘的基本知识及深度应用,熟练运用使用Python获取网络数据并独立开发常见的爬虫项目,熟练的进行文本分析处理, 适合零基础的初学者,也适合经验较为丰富的操作者
2、课程体系完整科学,可以系统学习并掌握Python数据预处理、分析与挖掘、可视化、机器学习与深度学习等核心算法原理以及全部技术的应用过程;熟悉Python在各种大数据技术产品中的应用;能够根据数据分布选择合适的算法模型并书写代码,对机器学习、数据挖掘运作机制有清晰全面的认识;
3、提供教学现场全程视频及PPT 、数据、程序;额外提供450G、90课时机器学习、深度学习、数据挖掘、网络爬虫与文本挖掘最新教学视频;建立微信交流平台,提供长期的技术支持与咨询服务。
二,技能认证
经培训考核合格,学员可获得通信和信息技术创新人才培养工程项目管理办公室《大数据分析师(高级)》职业技能证书,另可代为申请国家工信化部人才交流中心《数据分析师(高级)》职业技能水平培训证书
三,时间地点
2019年8月2日~8月6日 贵阳(2号报到)
注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。
查看更多
中国通信工业协会 (CCIA,以下简称协会)是一九九一年七月经民政部注册登记,由国内从事通信设备和系统及相关的配套设备、专用零部件的研究、生产、开发单位自愿联合组成的非营利的全国性社会团体。协会实行团体会员制度,中国普天信息产业集团、华为技术有限公司、中兴通讯、大唐电信、上海贝尔阿尔卡特、东方通信、康佳集团、方正科技、TCL通讯、海尔通信、宁波波导、申瓯通信、红图嘉和、首信集团、夏新电子、广州金鹏、联想移动、海信通信等国内大型通信工业企业都是协会的重要成员。协会理事会由中国普天信息产业集团公司等30多个单位组成。
会议日程 (最终日程以会议现场为准)
培训大纲
模块一 | 第1讲:网络爬虫技术基础与开发环境 | 1. 网络通信基础 2. Web开发与网站分析介绍 3. 开发环境安装与使用 4. Python基础数据结构与语法 5. 常用Python库使用案例分享 |
第2讲:网络爬虫工具库 | 1. 认识正则表达式 2. 基础Python爬虫库(urllib/Requests) 3.“漂亮”的爬虫库-Beautiful Soup 4. 静态网页爬取案例分享(论坛、维基百科、小说网站等) 5. Selenium与无头浏览器 6. Ajax和DHTML网站爬取 7. 动态网页爬取案例分享(图片网站、新闻网站、 | |
第3讲:网络爬虫存储 | 1. 文件读取与保存 2. 关系数据库存储-MySQL 3. 爬虫配合MySQL存储案例分享 4. 分布式存储-NoSQL数据库 5. 爬虫配合MongoDB存储案例分享 6. HDFS简介 | |
模块二 | 第4讲:网络爬虫框架 | 1.Python网络爬虫框架介绍 2.Scrapy基本使用 3.Scrapy进阶使用 4.爬虫框架使用案例分享(评论类网站、二手车网站等) |
第5讲:网络爬虫常用技巧 | 1. 表单处理 2. 模拟登录 3. 爬虫代理池 4. 各类网页内容处理 5. 设计隐蔽的网络爬虫 | |
第6讲:文本挖掘技术基础 | 1. 文本挖掘全流程概述 2. 自然语言处理库(NLTK) 3. TextBlob文本处理库介绍 4. 中文分词介绍(jieba) 5. 词云介绍 | |
模块三 | 第7讲:文本挖掘技术进阶 | 1. 文本挖掘预处理技术 2. 文本特征处理 3. 文本聚类与主题模型 4. 基于深度学习的文本挖掘 5. 文本挖掘案例分享(主题发现、新闻分类、情感分析等) |
第8讲:数据可视化技术基础 | 1. 数据可视化介绍 2常用Python可视化模块(matplotlib,seaborn) 3. 常用统计图绘制: 3.1条形图 3.2直方图 3.3面积图 3.4饼图 3.5箱线图 3.6散点图 | |
第9讲:数据可视化技术进阶 | 1. 交互式数据可视化 1.1更加‘美丽’的表达--pyecharts 1.2让你的图形有‘反馈’—bokeh 2. 地图可视化—basemap 3. 文本可视化--wordcloud 4. 网络图可视化—network 5. 爬虫技术、文本挖掘及数据可视化综合案例 | |
附加模块(视课程整体进度而定)
| 第10讲:Python数据挖掘实战 | Python数据挖掘技术概览: 1.数据挖掘与模型 2.建模流程和步骤 3.常见算法介绍 4.效果评估 |
数据挖掘典型项目流程示范: 1.数据探索性分析 2.数据探索中的可视化 3.特征处理和数据建模、 | ||
代码和案例实践: 1.泰坦尼克号沉船幸存者预测 2.Amazon员工访问需求预测 3.贷款违约风险预测 4.基于titanic数据集预测生存概率 5.演示如何进行绘图探索 | ||
第4天(8月6日) | 培训考核、参观贵阳“国家大数据中心” |
注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。
查看更多
会议嘉宾 (最终出席嘉宾以会议现场为准)
参会指南
会议门票 场馆介绍
早鸟票:3680元/人,原价:3980元/人
含上课期间专家授课费、教材资料、场地费等
注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。
查看更多
元和世纪酒店
温馨提示
酒店与住宿:
为防止极端情况下活动延期或取消,建议“异地客户”与活动家客服确认参会信息后,再安排出行与住宿。
退款规则:
活动各项资源需提前采购,购票后不支持退款,可以换人参加。
您可能还会关注
-
2025大健康产业技术创新(昆明)论坛 暨中生协特医食品及生物活性肽工作委员会第三届年会
2025-01-08 昆明
-
SECon 2025 全球软件工程技术大会·深圳
2025-06-20 深圳
-
数字孪生技术与AI大模型产教融合创新论坛
2025-04-19 南京
-
2024中国医药医疗CIO年会
2024-12-27 上海