全国高校大数据技术应用实战(Hadoop+Spark)师资研修班
时间:2022-01-13 09:00 至 2022-01-25 18:00
地点:线上活动
- 参会报名
- 会议介绍
- 会议日程
- 会议嘉宾
- 参会指南
-
手机下单
全国高校大数据技术应用实战(Hadoop+Spark)师资研修班 已截止报名课程时间: 2022-01-13 09:00至 2022-01-25 18:00结束 课程地点: 线上活动 主办单位: 泰迪杯数据挖掘挑战赛组委会
|
会议介绍
会议内容 主办方介绍
全国高校大数据技术应用实战(Hadoop+Spark)师资研修班宣传图
互联网、大数据、云计算、人工智能等现代信息技术深刻改变着人类的生产、生活、学习乃至思维方式,深刻展示了世界发展的前景。目前各院校的大数据和人工智能专业教师匮乏、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据、人工智能相关专业教师队伍,推动各院校建立人才培训和评价体系,特推出全国高校大数据与人工智能师资研修班,每年在全国范围内滚动开展,截止目前已在全国巡回举办50余场,参训教师近6000人次。2022年第一期全国高校大数据技术应用实战(Hadoop+Spark)师资研修班将以线上云课堂形式举办,现将有关安排通知如下。
课程特色
1、本研修班课程全程强调动手实操,内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合、更好地进行教育教学工作。
2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。视频制作精良,讲师真人出镜,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
3、课程设有答疑交流讨论群,培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,帮助学员更好地总结学习。
4、本课程配套有基础知识内容,即使零基础学员快也能找到适合自己的学习内容和节奏,快速掌握课程知识和技能。
5、所有课程相关源代码、数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。
6、全面实践大数据/人工智能项目流程,包括数据采集、数据存储管理、数据探索、数据处理、特征工程、数据建模等课程,提供知识讲解,助力夯实理论基础,掌握核心技术。
7、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。
课程安排
学习时间:2022年01月13日-01月25日,共计104学时
学习形式:培训以线上云课堂形式进行,支持六个月内免费回看
证书颁发
学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发高级大数据技术应用职业技术证书,证书可登录工业和信息化部教育与考试中心官网查询。
查看更多
会议日程 (最终日程以会议现场为准)
- 程大纲
基础篇(报名成功后即可开始学习) |
||
时间 |
课程内容 |
学习平台 |
正式培训前 |
Linux操作系统基础 1.Linux简介: 1.1 Linux简介与发展历程 1.2 Linux常见版本 2.Linux基本命令: 2.1 Linux文件系统树 2.2 创建与删除目录或文件 2.3 查看文件内容 2.4 创建硬链接和符号链接 2.5 帮助命令 2.6 重定向相关命令 2.7 用户及用户组 2.8 权限相关命令 2.9 用户、用户组及权限实践操作进程 3.Linux Vi编辑器: 3.1 模式介绍与常见快捷命令 3.2 一般模式快捷键 3.3 编辑模式与指令模式快捷键 |
泰迪云课堂 |
正式培训前 |
MySQL基础 1 数据库概述 1.1数据库概述 1.2 数据库基本概念介绍 2 MySQL安装与配置 2.1 MySQL安装与配置 2.2 可视化工具使用 3 MySQL基本命令 3.1 创建与删除数据库 3.2数据结构与数据类型 3.3 主键与外键 3.2 创建、修改、删除表 3.3 插入与删除数据 4 SQL语法操作 4.1 MySQL常用运算符 4.2 MySQL数据更新操作 4.2 MySQL数据查询操作 5 MySQL联表操作与子查询 5.1联表查询 5.2子查询 5.3复制表 6 MySQL函数 6.1 函数类型介绍 6.2 SQL函数应用 7 约束与索引 7.1 约束介绍与设置 7.2 索引介绍与设置 |
泰迪云课堂 |
正式培训前 |
Java编程基础 1.基础知识 1.1 Java简介 1.2 Java安装配置 1.3 Java基础语法 1.4.1 Java基本数据类型&引用数据类型 1.4.2 Java变量 1.5 Java String类 1.6.1 Java运算符-赋值运算符&算术运算符 1.6.2 Java运算符-关系、逻辑、其他运算符 1.7 循环、条件、循环中断 1.8 Java数组 1.9 Java函数 1.10.1 Java集合简介 1.10.2 Java集合之List 1.10.3 Java集合之Set 1.10.4 Java集合之Map 1.11 Java泛型 2.面向对象: 2.1 Java类、对象 2.2.1 Java类封装 2.2.2 Java构造函数 2.2.3 Java类继承 2.2.4 Java类多态 2.3.1 Java抽象类 2.3.2 Java接口 3.线程及异常处理: 3.1 Java多线程 3.2 Java包、异常 |
泰迪云课堂 |
核心课程篇 |
||
时间 |
课程内容 |
学习平台 |
专题讲座 |
||
2022年 01月13日 18:30-22:00 |
主讲:方海涛 主题内容:随机最优控制与人工智能 主讲:郝志峰 讲座主题:大数据视角下数字孪生与元宇宙的思考 |
泰迪云课堂 |
第一课 Hadoop大数据基础 |
||
2022年 01月13日 18:30-22:00 |
1.Hadoop介绍 1.1 认识大数据 1.2 Hadoop核心组件 1.3 Hadoop特性与生态环境 1.4 Hadoop应用场景 2.Hadoop集群安装与部署 2.1 安装虚拟机 2.2 安装Java 2.3 Hadoop集群部署模式 2.4 配置固定IP 2.5 配置ssh无密码登录 2.6 Hadoop集群安装与部署 2.7 Hadoop配置参数介绍 2.8 Hadoop集群启动与监控界面介绍 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
2022年 01月14日 18:30-22:00 |
3.Hadoop基础操作 3.1 Hadoop安全模式 3.2 Hadoop集群基本信息 3.3 HDFS常用Shell操作 3.4 MapReduce常用Shell操作 3.5 MapReduce任务管理 3.6 YARN资源管理及调度策略 4.MapReduce开发入门 4.1 MapReduce框架与设计构思 4.2 MapReduce开发环境搭建 4.3 MapReduce单词计数源码解析 4.4 MapReduce API介绍 4.5 MapReduce Java开发实战:按日期统计访问次数 4.7 MapReduce Java开发实战:用户访问次数排序 5. MapReduce编程进阶 5.1 MapReduce输出文件格式介绍及序列化文件生成 5.2 MapReduce输入文件格式介绍及读取序列化文件 5.3 MapReduce程序优化:Combiner&Partitioner应用 5.4 提交MapReduce程序 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
第二课 Hive大数据仓库 |
||
2022年 01月15日 18:30-22:00 |
1 Hive概述 1.1 Hive的产生背景 1.2 Hive体系架构 1.3 数据类型 1.4 与传统数据库的区别 1.5 Hive的应用 2 Hive安装配置 2.1 安装MySQL 2.2 安装Hive 3 Hive表定义 3.1 Hive创建内表和外表 3.2 Hive创建静态分区表 3.3 Hive创建动态分区表 3.4 创建带有数据的表 4 Hive导入导出数据 4.1 Hive导入本地或者HDFS上的数据 4.2 Hive单表查询和多表查询导入数据 4.3 Hive导出数据 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
2022年 01月16日 18:30-22:00 |
5 Hive查询 5.1 Hive查询语法及distinct操作 5.2 Hive order by和内置函数查询 5.3 Hive group by查询 5.4 Hive join查询 5.5 Hive子查询和case when查询 6 函数 6.1 Hive内置函数 6.2 Hive自定义函数 7综合实战:航空客户乘机数据预处理 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
第三课 HBase非关系型数据库 |
||
2022年 01月17日 18:30-22:00 |
1 HBase简介: 1.1 认识HBase 1.2 HBase适用场景 2 HBase安装配置: 2.1 HBase集群拓扑简介 2.2 Zookeeper集群安装配置 2.3 HBase安装配置 2.4 HBase监控界面讲解 3 HBase架构原理: 3.1 HBase数据模型 3.2 HBase架构 3.3 HBase读写流程 4 HBase Shell基本操作: 4.1 命令空间操作 4.2 创建表 4.3 修改和删除表 4.4 插入数据到表中 4.5 查看表数据 4.6 删除表数据 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
2022年 01月18日 18:30-22:00 |
5 HBase表的模式设计: 5.1 HBase表设计 6 HBase Java API应用: 6.1 搭建HBase开发环境 6.2 建立与HBase数据库连接实例 6.3 创建或删除表应用实例 6.4 设置Region分割点应用实例 6.5 修改表结构应用实例 6.6 写入数据应用实例 6.7 查看一行数据应用实例 6.8 扫描表数据应用实例 6.9 删除数据应用实例 6.10 创建职工信息表emp 6.11 写入数据到职工信息表 6.12 查找指定范围职工信息 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
第四课 Scala编程基础 |
||
2022年 01月19日 18:30-22:00 |
1 Scala简介与安装 1.1 Scala简介与特性 1.2 Scala安装 2 Scala基础语言 2.1 Scala数据类型 2.2 Scala变量 2.3 Scala运算符 2.4条件控制与循环 2.5函数 3 Scala集合 3.1 Scala集合—Array 3.2 Scala集合—List 3.3 Scala集合—Set 3.4 Scala集合—Map 3.5 Scala集合—Tuple 3.6内置函数组合器 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
2022年 01月20日 18:30-22:00 |
4 Scala异常 5 Scala类 5.1类定义 5.2构造函数 5.3成员变量和方法 5.4单例对象、伴生类和伴生对象 5.5文件读写 6 Scala应用实例 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
第七课 Spark大数据分析基础 |
||
2022年 01月21日 18:30-22:00 |
1 Spark概述 1.1认识Spark 1.2搭建Spark环境 1.3了解Spark运行架构与原理 1.4 Spark生态系统 2 Spark编程 3.1创建RDD 3.2 RDD Transform算子应用 3.3 RDD Action算子应用 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
2022年 01月22日 18:30-22:00 |
4 Spark编程进阶 4.1搭建开发环境 4.2编程实现学生信息分析 4.3程序编译 4.4任务提交与运行模式 4.5查看任务监控 4.6 RDD持久化 4.7 RDD依赖与容错 5 Spark SQL:结构化数据文件处理 5.1认识Spark SQL 5.2认识DataFrame、DataSet 5.2掌握DataFrame基础操作 5.3探索分析法律服务网站数据 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
2022年 01月23日 18:30-22:00 |
6 Spark与机器学习库 6.1机器学习简介 6.2 MLlib各模块简介 6.3探索分析模块 6.4算法模块 6.5模型评估与优化模块 6.6 PipeLine介绍 6.7 PipeLine整合预处理、建模、调优、评估过程 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
第八课 项目实战:广电大数据用户画像(Hadoop + Spark + Hive) |
||
2022年 01月24日 18:30-22:00 |
1项目需求 1.1项目背景 1.2项目目标 2技术方案 2.1技术选型 2.2系统架构 3数据存储与传输 3.1创建Hive表 3.2 CSV数据导入到Hive 4需求探索 4.1数据说明 4.2基础探索 4.3业务需求探索 4.4需求探索总结 5基础数据预处理 6 SVM预测用户是否挽留 6.1 SVM算法简介 6.2构建特征列和标签列数据 6.3建立SVM模型 6.4模型评估与预测 7用户画像 7.1用户画像概述 7.2标签计算 7.3标签展示 |
泰迪云课堂 |
操作演练/作业 |
泰迪大数据编程实训平台 |
|
在线答疑 |
微信群 |
|
拓展自学篇 |
||
自行安排 |
1 Zookeeper分布式服务框架 2 Flume大数据采集与传输 3 Kafka大数据流处理 4 Flink大数据实时处理 5 商品实时推荐系统(Flume + Kafka + Flink) |
泰迪云课堂 |
第九课 在线考试 |
||
2022年 01月25日 19:00-21:00 |
高级大数据技术应用职业技术证书在线考试 |
泰迪云课堂 |
查看更多
会议嘉宾 (最终出席嘉宾以会议现场为准)
方海涛,中国科学院数学与系统科学研究院研究员,博士生导师,《控制理论与应用》杂志副主编,泰迪杯数据挖掘挑战赛专家组成员。主要研究兴趣包括:系统估计、优化与控制等。
张敏,广东泰迪智能科技股份有限公司、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通Python、R语言、MATLAB等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师,2019年第一/二/三期全国高校大数据核心技术与应用师资研修班主讲讲师、2020年第一/二/三/四/五/六期全国高校大数据与人工智能师资研修班主讲讲师,2020年国培班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。
律波,广东泰迪智能科技有限公司高级数据分析工程师,应用统计学硕士,有较强的统计学、数学、数据挖掘理论功底;精通R、Python、Power BI、Excel等数据挖掘分析工具,具有丰富的培训和项目经验,擅长从数据中发掘规律,对数据具有较高的敏感度,逻辑思维能力强,擅长数据可视化,机器学习、深度学习等算法原理的实现,如神经网络、SVM、决策树、贝叶斯等;负责“珠江数码大数据营销推荐应用”项目,完成标签库的构建及产品推荐模型;负责“京东电商产品评论情感分析”项目,完成了评论数据情感评价模型、LDA主题模型的构建;通过项目案例的转换;负责多个本科类院校数据分析软件培训和毕业生数据分析培训,先后负责广西科技大学、闽江学院、广东石油化工、韩山师范学院、广西师范大学等数据分析软件培训及实训等。多次负责“泰迪杯”数据挖掘大赛题目的构思和实现、赛前培训。大数据专业系列图书编写委员会成员,负责《R语言与数据挖掘》、《Python实训案例》、《Excel可视化案例》等书籍编写工作。
杨惠,广东泰迪智能科技股份有限公司高级数据分析师,从事人工智能工作多年,擅长计算机视觉和自然语言处理,熟悉常用深度学习算法原理及应用,如神经网络、SVM、强化学习等算法;精通TensorFlow、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如“智能聊天客服”项目,“车牌智能识别”项目,“京东电商产品评论情感分析”项目,“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目;“基于Seq2Seq注意力模型实现聊天机器人”项目。具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。大数据专业系列图书编写委员会成员,负责《Python数据分析与应用》、《R语言编程基础》、《TensorFlow2深度学习实战》、《深度学习与计算机视觉实战》等书籍编写工作。
樊老师,广东泰迪智能科技股份有限公司特聘讲师,某国际银行大数据开发工程师,Hortonworks授权Apache Hadoop开发者认证培训讲师,Hadoop、Mahout技术实践者和研究者;对Hadoop的MapReduce编程模型有深刻理解,同时对Mahout技术有较深认识,对Mahout源码有深入研究,擅于Mahout中数据挖掘的K均值聚类算法、贝叶斯分类算法、FP树关联规则算法的应用;主编《Mahout算法解析与案例实战》、《Hadoop数据分析与挖掘实战》、《Hadoop与大数据挖掘》等图书专著;具有电信行业和银行业的项目经验和行业知识,主持中国电科院电力大数据平台、电能量数据挖掘与智能分析、客户服务智能分析系统等项目。
查看更多
参会指南
会议门票
培训费用:2980 元/人,包含(报名费、学习费、资料费、证书费)
报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:背景:白色,格式:JPG,大小:14-20K)。
查看更多
温馨提示
酒店与住宿:
为防止极端情况下活动延期或取消,建议“异地客户”与活动家客服确认参会信息后,再安排出行与住宿。
退款规则:
活动各项资源需提前采购,购票后不支持退款,可以换人参加。