全国高校数据分析与挖掘实战师资研修班1月广州培训班
时间:2021-01-20 09:00 至 2021-01-25 18:00
地点:广州
- 参会报名
- 会议介绍
- 会议日程
- 会议嘉宾
- 参会指南
-
手机下单
全国高校数据分析与挖掘实战师资研修班1月广州培训班 已截止报名课程时间: 2021-01-20 09:00至 2021-01-25 18:00结束 主办单位: 全国高校大数据教育创新联盟
|
会议介绍
会议内容 主办方介绍
全国高校数据分析与挖掘实战师资研修班1月广州培训班宣传图
主办单位:全国高校大数据教育创新联盟
泰迪杯数据挖掘挑战赛组委会
承办单位:广东泰迪智能科技股份有限公司
协办单位:人民邮电出版社有限公司
北京泰迪云智信息技术研究院
各有关院校:
国家十三五规划纲要明确提出“实施国家大数据战略,推进数据资源开放共享”,为我国在大数据领域的未来发展绘制了宏伟的蓝图,开启了我国大数据发展的新时代。教育部《高等学校人工智能创新行动计划》及国务院颁布的《新一代人工智能发展规划》,责成科技司、基教司、职成司、高教司、地方各级教育行政部门大力推动人工智能、大数据等新技术在教育教学中的深入应用,推进信息技术与高等教育教学深度融合。从发布对人工智能、大数据等新技术与教育结合的指导性文件到直接扶持建设相关教学项目,为高校进行教学改革和升级教学手段和方式指明了新的方向。
大数据及人工智能产业的发展对人才提出了新的需求,国内各高校在积极进行学术研究的同时,已经将大数据与人工智能教育纳入培养体系。为帮助高校适时调整课程体系、继续深化教学改革,指导数据智能学科建设和跨学科人才培养,进一步提升教学能力和科研能力,全国高校大数据教育创新联盟联合泰迪杯数据挖掘挑战赛组委会将于2021年1月20-25日举办“全国高校Python数据分析与挖掘实战师资研修班” ,现将有关通知如下:
一、课程介绍
随着大数据时代的到来,对于数据的要求不仅仅是存储和管理,更重要的是需要对大量数据进行分析、加工最后再决策。数据分析与挖掘可以从海量数据中获得别人看不见的信息,创业者可以通过数据分析来优化产品,营销人员可以通过数据分析改进营销策略,产品经理可以通过数据分析洞察用户习惯,金融从业者可以通过数据分析规避投资风险,程序员可以通过数据分析进一步挖掘出数据价值。
本次培训采用“线下精讲+专家技术现场答疑指导+学员群内实操答疑+助教指导”结合的方式,主要讲解了使用Python进行数据分析与挖掘的相应理论与代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。
二、课程目标及收获
1、本课程全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
3、全面实践商务数据分析流程,包括数据处理、数据探索、数据建模等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。
4.无论是前置学习篇还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。
三、研修对象
各高等院校大数据、人工智能相关学科、计算机、网络通信、自动化、电子工程、数理统计等专业的科研、教学带头人、骨干教师、博士生、硕士生、本科生、大专生;
从事计算机、云计算、大数据、人工智能、互联网等相关领域项目的科研院所的项目负责人、科研人员、工程技术人员等。
四、时间与方式
培训时间:2021年1月20-25日
培训地点:广州(泰迪科技公司总部)
证书颁发
学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“高级大数据技术应用职业技术证书”,证书可登录国家工业和信息化部教育与考试中心官网查询。
查看更多
会议日程 (最终日程以会议现场为准)
培训内容
第一部分:线上学习 |
学习时间 |
报名成功后即可开始学习 |
|||||||
时间 |
课程内容 |
学习平台 |
|||||||
正式培训前 |
Python编程基础 1准备工作 2列表操作 3程序流程控制语句 4字符串操作 4.1字符串及其索引&切片 4.2字符串的常见方法 4.3字典的创建及索引 4.4字典常用操作 4.5字典推导式 5Python文件读取操作 5.1Python读取文件 5.2练习3:统计小说中的单词频次 6函数 6.1Python函数自定义 6.2练习4:自定义求序列偶数个数的函数 7面向对象与模块 7.1Python方法与函数对比介绍 7.2Python面向对象示例 7.3Python模块使用 7.4第三方库的安装与调用 8注意事项 8.1Python工作路径说明 8.2模块命名及存放路径的注意事项 8.3结语 |
泰迪云课堂 |
|||||||
第二部分:线下实战 |
学习时间 |
2021年1月20日-24日 |
|||||||
时间 |
课程内容 |
学时 |
|||||||
1月20日 |
报到 |
全天 |
|||||||
1月21日 |
Python数据分析与应用 1 Python数据分析概述 1.1认识数据分析 1.2熟悉Python数据分析的工具 1.3安装Python3的Anaconda发行版 1.4掌握Jupyter Notebook常用功能 2 使用Pandas进行数据预处理 2.1合并数据 2.2清洗数据 2.3标准化数据 2.4转换数据 Python数据分析实训 练习1 探索Chipotle快餐数据 1.将数据集存入一个名为chipo的数据框内 2.查看前10行内容 3.数据集中有多少个列(columns)? 4.打印出全部的列名称 5.数据集的索引是怎样的? 6.被下单数最多商品(item)是什么? 7.在item_name这一列中,一共有多少种商品被下单? 8.一共有多少个商品被下单? 9.将item_price转换为浮点数 10.在该数据集对应的时期内,收入(revenue)是多少? 11.在该数据集对应的时期内,一共有多少订单? 12.每一单(order)对应的平均总价是多少? 练习2 用户用电量统计分析 1.将数据进行转置,转置后行为用户编号、列为日期、值为用户每日用电量。 2.对数据中的异常数据进行识别并处理。 3.统计每个用户用电数据的基本统计量,包括:最大值、最小值、均值、中位数、和、方差、偏度、峰度。 4.每个用户用电数据按日差分,并求取差分结果的基本统计量,统计量同3。 5.求取每个用户的5%分位数。 6.每个用户按周求和并差分(一周7天,年度分开),并求取差分结果的基本统计量,统计量同3。 7.统计每个用户的日用电量在其最大值0.9倍以上的次数。 8.合并上述特征。 |
9:00-12:00 14:00-17:00 |
|||||||
1月22日 |
机器学习实践 1机器学习绪论 1.1引言 1.2基本术语 1.3假设空间&归纳偏好 2模型评估与选择 2.1经验误差与过拟合 2.2评估方法 2.3性能度量 2.4性能度量Python实现 市财政收入预测 1 背景与案例目标 2 相关系数分析 2.1求解person相关系数 2.2person相关系数解读 3 Lasso回归特征提取 3.1了解Lasso回归方法 3.2Lasso回归选取关键特征的实现 3.3Lasso回归数据写出及相应解读 4 灰色预测模型 4.1关键特征数据读取及准备 4.2GM11特征值预测 4.3GM11特征数据整理及写出 5 模型训练及预测 5.1数据标准化 5.2模型训练及预测 5.3结果可视化 垃圾短信智能识别 1 背景与目标 2 数据探索 2.1数据读取 2.2数据抽取 3 数据预处理 3.1去除短信中的x序列 3.2结巴分词 3.3去除停用词 3.4数据预处理函数封装 3.5垃圾短信的词频统计 3.6词云图绘制 4 文本向量的表示 4.1文本数据的向量化表达 4.2获取训练样本的tf-idf权值向量 4.3获取测试样本的tf-idf权值向量 5 模型训练及评价 6 小结 |
9:00-12:00 14:00-17:00 |
|||||||
1月23日 |
Python网络爬虫 1 Python爬虫介绍 1.1 认识爬虫 1.2 认识反爬虫 1.3 Python爬虫环境 2 网页爬虫 2.1 了解Python爬虫基本流程 2.2 实现HTTP请求 2.3 网页解析 2.4 数据存储 3 常规动态网页爬取 3.1 常规动态网页爬取概述 3.2 逆向分析爬取动态网页 3.3 使用Selenium打开浏览对象 3.4 Selenium页面等待 3.5 使用Selenium获取图书信息 Python爬虫实战 练习1 爬取网站“泰迪智能科技”(http://www.tipdm.com/)导航条的信息。 练习2 爬取“泰迪智能科技”(http://www.tipdm.com/)新闻中心中公司新闻的信息(新闻标题+新闻内容) 练习3 获取人邮网站新书资讯 练习4 采集京东商品评论数据 |
9:00-12:00 14:00-17:00 |
|||||||
1月24日 |
综合实战:电商智能推荐--优惠券使用预测 1 背景与目标 2 数据说明 2.1线下训练集数据介绍 2.2线上训练集数据介绍 2.3测试数据介绍 2.4项目流程介绍 3 数据预处理 3.1构建正样本 3.2构建负样本 3.3构建样本标签 4 特征构建 4.1特征构建介绍 4.2处理Discount_rate列 4.3特征1-折扣率 4.4特征2-商户与用户之间的距离 5 模型训练 5.1建模前数据准备 5.2初级模型构建 5.3ROC曲线与AUC值 5.4模型性能评估 5.5训练函数封装 5.6模型预测 5.7预测函数封装 6 特征完善 6.1特征3-优惠券流行度 6.2特征4-用户在商家中的消费次数 6.3如何进行特征拼接 6.4拼接训练集的特征3&4 6.5拼接测试及的特征3&4 7 预测 7.1模型训练 7.2预测 7.3代码整理 7.4结果提交 |
9:00-12:00 14:00-17:00 |
|||||||
1月25日 |
大数据企业参观访学 |
||||||||
认证考试 工信部教育与考试中心高级大数据技术应用职业技术认证在线考试 |
泰迪云课堂 |
查看更多
会议嘉宾 (最终出席嘉宾以会议现场为准)
课程主讲师资介绍
冯国灿 博士,中山大学数学学院教授,博士生导师。泰迪杯数据挖掘挑战赛组委会委员,中国工业与应用数学会常务理事,广东省工业与应用数学学会理事长, 2000-2002英国格莱莫根大学数字图像实验室和布拉德福大学数字媒体实验室做博士后研究员。主要从事模式识别、计算机视觉研究,参加主持包括国家自然科学基金等科学基金20多项,发表学术论文100余篇,入选2014-2019爱思唯尔计算机科学中国高被引学者排行榜。
张敏 广东泰迪科技高级数据分析师、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通Python、R语言、Matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师,2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。
杨惠 广东泰迪科技高级数据分析师,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训; 2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络RNN,熟悉常用机器学习算法原理及应用,如神经网络、SVM、决策树、贝叶斯等算法;精通R、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如“京东电商产品评论情感分析”项目;“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目。
查看更多
参会指南
会议门票
报名材料及费用说明
1. 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版
(要求:背景:白色,格式:JPG,大小:14-20K)。
2. 培训费用: 3900 元/人,包含(报名费、学习费、场地费、资料费、证书费)。
3. 因疫情管控,本期线下班限额40人,培训班学员住宿统一安排,食宿费用自理。。
查看更多
温馨提示
酒店与住宿:
为防止极端情况下活动延期或取消,建议“异地客户”与活动家客服确认参会信息后,再安排出行与住宿。
退款规则:
活动各项资源需提前采购,购票后不支持退款,可以换人参加。