全国高校大数据分析与机器学习实战(Python)师资研修班
时间:2022-01-14 09:00 至 2022-01-23 18:00
地点:线上活动
- 参会报名
- 会议介绍
- 会议日程
- 会议嘉宾
- 参会指南
-
手机下单
全国高校大数据分析与机器学习实战(Python)师资研修班 已截止报名课程时间: 2022-01-14 09:00至 2022-01-23 18:00结束 课程地点: 线上活动 主办单位: 泰迪杯数据挖掘挑战赛组委会
|
会议介绍
会议内容 主办方介绍
全国高校大数据分析与机器学习实战(Python)师资研修班宣传图
互联网、大数据、云计算、人工智能等现代信息技术深刻改变着人类的生产、生活、学习乃至思维方式,深刻展示了世界发展的前景。目前各院校的大数据和人工智能专业教师匮乏、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据、人工智能相关专业教师队伍,推动各院校建立人才培训和评价体系,特推出全国高校大数据与人工智能师资研修班,每年在全国范围内滚动开展,截止目前已在全国巡回举办50余场,参训教师近6000人次。2022年第一期全国高校大数据分析与机器学习实战(Python)师资研修班将以线上云课堂形式举办,现将有关安排通知如下。
课程特色
1、本研修班课程全程强调动手实操,内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合、更好地进行教育教学工作。
2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。视频制作精良,讲师真人出镜,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
3、课程设有答疑交流讨论群,培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,帮助学员更好地总结学习。
4、本课程配套有基础知识内容,即使零基础学员快也能找到适合自己的学习内容和节奏,快速掌握课程知识和技能。
5、所有课程相关源代码、数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。
6、全面实践大数据/人工智能项目流程,包括数据采集、数据存储管理、数据探索、数据处理、特征工程、数据建模等课程,提供知识讲解,助力夯实理论基础,掌握核心技术。
7、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。
课程安排
学习时间:2022年01月14日-01月23日,共计80学时
学习形式:培训以线上云课堂形式进行,支持六个月内免费回看
证书颁发
学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发高级机器学习工程师职业技术证书,证书可登录工业和信息化部教育与考试中心官网查询。
查看更多
会议日程 (最终日程以会议现场为准)
- 课程大纲
基础篇(报名成功后即可开始学习) |
||
时间 |
课程内容 |
学习平台 |
正式培训前 |
Python编程基础 1准备工作 2列表操作 3程序流程控制语句 4字符串操作 4.1字符串及其索引&切片 4.2字符串的常见方法 4.3字典的创建及索引 4.4字典常用操作 4.5字典推导式 5Python文件读取操作 5.1Python读取文件 5.2练习3:统计小说中的单词频次 6函数 6.1Python函数自定义 6.2练习4:自定义求序列偶数个数的函数 7面向对象与模块 7.1Python方法与函数对比介绍 7.2Python面向对象示例 7.3Python模块使用 7.4第三方库的安装与调用 8注意事项 8.1Python工作路径说明 8.2模块命名及存放路径的注意事项 8.3结语 |
泰迪云课堂 |
正式培训前 |
NumPy数值计算基础 1 Python数据分析概述 1.1 认识数据分析 1.2 熟悉Python数据分析的工具 1.3 安装anaconda与启动Jupyter Notebook 1.4 掌握Jupyter Notebook常用功能 2 NumPy数值计算基础 2.1 掌握NumPy数组对象 2.1.1NumPy简介 2.1.2 数组创建及基础属性 2.1.3 初识数组的特点 2.1.4 创建常用数组 2.1.5 数组数据类型 2.1.6 生成随机数 2.1.7 一维数组的索引 2.1.8 逻辑型索引 2.1.9 多维数组的索引 2.1.10 求解距离矩阵 2.1.11 变化数组shape 2.2 掌握NumPy矩阵与通用函数 2.2.1 NumPy矩阵介绍 2.2.2 NumPy通用函数介绍 2.2.3 通用函数的广播机制 2.3 利用NumPy进行统计分析 2.3.1 NumPy读写二进制文件 2.3.2 NumPy读写txt文件 2.3.3 利用NumPy对数据进行简单统计分析 |
泰迪云课堂 |
核心课程篇 |
||
时间 |
课程内容 |
学习平台 |
专题讲座 |
||
2022年 01月14日 18:30-22:00 |
主讲:方海涛 主题内容:随机最优控制与人工智能 主讲:郝志峰 讲座主题:大数据视角下数字孪生与元宇宙的思考 |
泰迪云课堂 |
第一课 Python数据分析与应用 |
||
2022年 01月14日 18:30-22:00 |
1 Pandas统计分析基础 1.1 Pandas简介 1.2 读写不同数据源的数据 1.2.1 Pandas读取文本数据 1.2.2 存储数据框 1.2.3 Pandas读取excel文件 1.2.4 将数据框存储为excel文件 1.3 数据框与数据框元素 1.3.1 构建数据框 1.3.2 查看数据框的常用属性 1.3.3 按行列顺序访问数据框中的元素 1.3.4 按行列名称访问数据框中的元素 1.3.5 修改数据框中的元素 1.3.6 删除数据框中的元素 1.3.7 描述分析数据框中的元素 1.4 转换与处理时间序列数据 1.4.1 转换成时间类型数据 1.4.2 时间类型数据的常用操作 1.5 使用分组聚合进行组内计算 1.5.1 groupby分组操作 1.5.2 agg聚合操作 1.6 创建透视表与交叉表 1.6.1 生成透视表 1.6.2 生成交叉表 2 使用Pandas进行数据预处理 2.1 合并数据 2.1.1 表堆叠 2.1.2 主键合并 2.1.3 重叠合并 2.2 清洗数据 2.2.1 检测与处理重复值 2.2.2 检测与处理缺失值 2.2.3 检测与处理异常值 2.3 标准化数据 2.4 转换数据 2.4.1 哑变量处理 2.4.2 离散化连续型数据 |
泰迪云课堂 |
操作演练 |
个人PC |
|
在线答疑 |
微信群 |
|
第二课 Python数据可视化 |
||
2022年 01月15日 18:30-22:00 |
1.1 Matplotlib绘制流程说明 1.2 添加文本和修改绘图风格 1.3 rc参数 1.4 散点图 1.5 折线图 1.6 直方图和条形图 1.7 饼图 1.8 箱线图 1.9 人口特征间分布 1.10 人口各个特征分布 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
拓展自学篇 |
||
自行安排 |
2.1 seaborn基础介绍 2.2 seaborn简单绘图 2.3 seaborn绘图风格 2.4 调色板1 2.5 调色板2 2.6 关系图 2.7分类图 2.8分布图 2.9回归图 2.10矩阵图 2.11网格图 3.1 Pyecharts基础介绍 3.2 Pyecharts绘制日历图 3.3 Pyecharts绘制漏斗图 3.4Pyecharts绘制仪表盘 3.5Pyecharts绘制水球图 3.6Pyecharts绘制关系图 3.7Pyecharts绘制直角坐标系图表 3.8Pyecharts绘制饼图 3.9Pyecharts绘制雷达图 3.10Pyecharts绘制词云图 3.11Pyecharts绘制柱状图 3.12Pyecharts绘制树形图 3.13Pyecharts绘制地理图表 |
泰迪云课堂 |
第三课 Python机器学习实战 |
||
2022年 01月16日 18:30-22:00 |
1.1引言 1.2基本术语 1.3假设空间&归纳偏好 2.1经验误差与过拟合 2.2评估方法 2.3性能度量 2.4性能度量Python实现 3.1线性回归基本形式 3.2线性回归模型的Python实现 3.3波士顿房价预测的Python实现 3.4逻辑回归介绍 3.5研究生入学录取预测的Python实现 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
2022年 01月18日 18:30-22:00 |
4.1从女生相亲到决策树 4.2明天适合打球吗 4.3决策树拆分属性选择 4.4决策树算法家族 4.5泰坦尼克号生还者预测—数据预处理 4.6泰坦尼克号生还者预测—模型构建与预测 5.1聚类分析概述 5.2相似性度量 5.3K-Means聚类分析算法介绍 5.4利用K-Means算法对鸢尾花进行聚类 5.5聚类结果的性能度量 5.6调用scikit-learn实现聚类分析 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
2022年 01月19日 18:30-22:00 |
6.1单个神经元介绍 6.2经典网络结构介绍 6.3神经网络工作流程演示 6.4如何修正网络参数-梯度下降法 6.5网络工作原理推导 6.6网络搭建准备 6.7样本从输入层到隐层传输的Python实现 6.8网络输出的Python实现 6.9单样本网络训练的Python实现 6.10全样本网络训练的Python实现 6.11网络性能评价 6.12调用scikit-learn实现神经网络算法 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
拓展自学篇 |
||
自行安排 |
7支持向量机 7.1非洲人还是北美人 7.2为什么有“朴素”二字 7.3拉普拉斯修正 7.4用高斯朴素贝叶斯算法解决鸢尾花分类问题 8 集成学习 8.1 集成学习基本概念 8.2 并行集成算法-Bagging&RandomForest 8.3 串行集成算法-Boosting算法流程 8.4 串行集成算法-Boosting代码实现 8.5 Stacking算法流程 8.6 Stacking代码实现 |
泰迪云课堂 |
第四课 实战案例:运营商流失用户分析与预测 |
||
2022年 01月20日 18:30-22:00 |
1.1背景与目标 1.2案例思路分析 2.1数据探索 2.2数据去重及删除无关属性 2.3用户分组及标签构建 2.4提取用户基本信息和在网时长 2.5处理合约是否有效 2.6处理合约计划到期时间 2.7其余变量处理 2.8特征拼接及缺失值处理 2.9数据保存 3.1特征选择介绍 3.2皮尔逊特征选择 3.3处理样本类别不均衡问题 4.1模型性能评估介绍 4.2模型构建及性能评估 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
第五课 实战案例:信用评分卡建模分析 |
||
2022年 01月21日 18:30-22:00 |
1.背景思路 1.1 金融风控背景说明 1.2 案例分析流程说明 1.3 案例思路过程说明 2.基于逻辑回归的贷款违约预测分析 2.1 数据读取与分析 2.2 数据预处理 2.2.1 缺失值处理 2.2.2 重复值处理 2.2.3 异常值处理 2.3 数据探索性分析 2.3.1 变量分布特征探索分析 2.3.2 各个变量与是否违约的数据探索分析 2.4 特征选择 2.5 建模分析 2.5.1 划分数据集 2.5.2 建立逻辑回归模型 2.5.3 模型评估分析 3.基于WOE信用评分的逻辑回归模型建立信用评分卡 3.1 特征选择 3.1.1 分箱处理 3.1.2 相关分析 3.1.3 IV筛选 3.2 建模分析 3.2.1 WOE转换 3.2.2 模型建立 3.2.3 模型检验 3.3 信用评分卡构建 4.总结 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
第六课 实战案例:百货商场用户画像描绘与价值分析 |
||
2022年 01月22日 18:30-22:00 |
1.1 背景与分析目标 2.1 会员信息表处理 2.2 销售流水表处理 3.1 会员年龄分析 3.2 不同年龄的消费能力 3.3 不同性别的消费情况 3.4 会员和非会员消费情况 3.5 商场会员年消费趋势 3.6 不同月份的消费趋势 3.7 每年每月的消费金额趋势 3.8 不同时刻的消费情况 4.1 用户画像介绍 4.2 会员基本信息标签 4.3 会员消费特征标签 4.4 会员商品偏好标签 4.5 生成用户画像 5.1 会员细分介绍 5.2 K-Means算法实现会员聚类 5.3 结果分析 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
第七课 实战案例:天猫用户重复购买预测 |
||
2022年 01月23日 18:30-22:00 |
1.1 背景与挖掘目标 2.1 工程环境准备 2.2 缺失值处理和数据去重 2.3 数据分布探索 3.1 特征工程介绍 3.2 原始特征 3.3.1 用户相关特征:用户在平台的总交互次数 3.3.2 用户相关特征:用户最近一次购买距离第一次的时长 3.4.1 商家相关特征:商家被交互的数量 3.4.2 商家相关特征:商家的复购次数 3.5.1 用户和商家相关特征:用户在商家的交互次数 3.5.2 用户和商家相关特征:不同用户在不同商家购买率 3.6 离散型特征处理 4.1 建模前的数据处理 4.2 模型构建 4.3 模型训练和评估 4.4 模型应用 5 小结 |
泰迪云课堂 |
操作演练/作业 |
个人PC |
|
在线答疑 |
微信群 |
|
第八课 在线考试 |
||
2022年 01月24日 19:00-21:00 |
高级机器学习工程师职业技术证书在线考试 |
泰迪云课堂 |
查看更多
会议嘉宾 (最终出席嘉宾以会议现场为准)
方海涛
中国科学院数学与系统科学研究院研究员,博士生导师,《控制理论与应用》杂志副主编,泰迪杯数据挖掘挑战赛专家组成员。主要研究兴趣包括:系统估计、优化与控制等。
张敏
广东泰迪智能科技股份有限公司、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通Python、R语言、MATLAB等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师,2019年第一/二/三期全国高校大数据核心技术与应用师资研修班主讲讲师、2020年第一/二/三/四/五/六期全国高校大数据与人工智能师资研修班主讲讲师,2020年国培班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。
律波
广东泰迪智能科技有限公司高级数据分析工程师,应用统计学硕士,有较强的统计学、数学、数据挖掘理论功底;精通R、Python、Power BI、Excel等数据挖掘分析工具,具有丰富的培训和项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习、深度学习等算法原理的实现,如神经网络、SVM、决策树、贝叶斯等;负责“珠江数码大数据营销推荐应用”项目,完成标签库的构建及产品推荐模型;负责“京东电商产品评论情感分析”项目,完成了评论数据情感评价模型、LDA主题模型的构建;通过项目案例的转换;负责多个本科类院校数据分析软件培训和毕业生数据分析培训,先后负责广西科技大学、闽江学院、广东石油化工、韩山师范学院、广西师范大学等数据分析软件培训及实训等。多次负责“泰迪杯”数据挖掘大赛题目的构思和实现、赛前培训。大数据专业系列图书编写委员会成员,负责《R语言与数据挖掘》、《Python实训案例》、《Excel可视化案例》等书籍编写工作。
杨惠,广东泰迪智能科技股份有限公司高级数据分析师,从事人工智能工作多年,擅长计算机视觉和自然语言处理,熟悉常用深度学习算法原理及应用,如神经网络、SVM、强化学习等算法;精通TensorFlow、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如“智能聊天客服”项目,“车牌智能识别”项目,“京东电商产品评论情感分析”项目,“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目;“基于Seq2Seq注意力模型实现聊天机器人”项目。具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。大数据专业系列图书编写委员会成员,负责《Python数据分析与应用》、《R语言编程基础》、《TensorFlow2深度学习实战》、《深度学习与计算机视觉实战》等书籍编写工作。
查看更多
参会指南
会议门票
培训费用:1980 元/人,包含(报名费、学习费、资料费、证书费)
报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:背景:白色,格式:JPG,大小:14-20K)。
查看更多
温馨提示
酒店与住宿:
为防止极端情况下活动延期或取消,建议“异地客户”与活动家客服确认参会信息后,再安排出行与住宿。
退款规则:
活动各项资源需提前采购,购票后不支持退款,可以换人参加。