专业介绍

大数据技术专业

时间:2022-06-01  来源:郑州城市职业学院

专业名称及代码 

专业名称:大数据技术

专业代码:510205

入学要求

普通高中毕业、中等职业学校毕业或具备同等学力。

修业年限

全日制三年。

职业面向

所属专业大类(代码):电子信息大类(610)

所属专业类(代码):计算机类(6102)

对应行业(代码):互联网数据服务(6450)

主要岗位类别(或技术领域):数据开发工程师;数据分析师;数据挖掘工程师;

专业对应的职业资格证书或技能等级证书:数据分析师证;初级程序员;华为HCNP认证;OCA证书;OCP证书;OCM证书;

培养目标与培养规格

一、培养目标

本专业以 “面向一线、立足岗位、产学结合、注重素质、突出应用、强化实践、培养能力”为指导思想,面向中国特色社会主义建设,对接战略性主导产业和新兴产业中大数据或数据挖掘的工程重点领域的人才需求,具有良好的职业道德和职业精神,能从事计算机软硬件产品及大数据或数据挖掘的工程性开发与实现、在计算机与互联网企业中从事系统集成或售后服务、数据处理与分析、在政府部门]或企事业单位从事信息系统的建设、管理、运行、维护的技术工作,具备德、智、体、美等方面全面发展的高素质技术应用性人才。

二、培养规格

本专业毕业生应在素质、知识和能力等方面达到以下要求:

1.素质

(1) 坚定拥护中国共产党领导和我国社会主义制度,在习近平新时代中国特色社会主义思想指引下,践行社会主义核心价值观,具有深厚的爱国情感和中华民族白豪感。

(2) 崇尚宪法、遵法守纪、崇德向善、诚实守信、尊重生命、热爱劳动,履行道德准则和行为规范,具有社会责任感和社会参与意识。

(3) 具有质量意识、环保意识、安全意识、信息素养、工匠精神、创新思维。

(4) 勇于奋斗、乐观向上,具有自我管理能力、职业生涯规划的意识,有较强的集体意识和团队合作精神。

(5) 具有健康的体魄、心理和健全的人格,掌握基本运动知识和1-2项运动技能,养成良好的健身与卫生习惯,以及良好的行为习惯。

(6) 具有一定的审美和人文素养,能够形成1-2项艺术特长或爱好。

2.知识

(1) 掌握本专业所必须的英语、数学及文化基础知识。

(2) 具备必要的人文、社会科学等通识知识。

(3)具备计算机应用的基本知识,包括文字录入与编辑、数据基本处理、电子表格、演示文稿等的制作等知识。

(4)熟悉SQL的计算与存储过程调优,并且具有严密的逻辑分析能力。

(5)掌握当前使用最为广泛的两门数据挖掘编程语言R语言和Python。

(6)具备数据的处理、抽取、清洗、转换等能力。

(7)掌握主流的Hadoop处理技术,包括MapReduce、 Hive、 Hbase等。

3.能力

对大数据基础架构和平台有深刻理解;熟悉Hadoop集群构建,能进行相应的部署及配置;熟悉主流应用服务器的架构体系以及各种中间件技术。

4.毕业生具备的职业态度

(1)遵守相关法律法规、标准和管理规定。

(2)爱岗敬业,严谨务实,团结协作,具有良好的职业操守。

(3)具有良好的规范意识、合作意识和工作责任心。

课程设置及要求

(一)公共基础课程

思想道德修养与法律基础、毛泽东与中国特色社会主义、形势与政策、军事技能、军事理论、安全教育、心理健康教育、大学体育与健康、职业规划与职业素养、创新创业教育、职业发展与就业指导、优秀传统文化教育、计算机应用基础、应用文写作、大学英语、高等数学

    (二)专业(技能)课程

1.专业基础课

①《大数据技术导论》课程

教学目标及教学要求:主要培养学生大数据平台运维、大数据分析和数据可视化基本思想和基本技能,为后续的数据挖掘应用性课程和数据产品开发课程的学习打好编程基础。

教学内容:大数据概论、大数据生态系统、大数据采集与预处理、大数据库、大数据分析。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

②《Python程序设计》课程

教学目标及教学要求:本课程培养学生应用框图表达算法的能力及用Python 基础知识编写程序的能力。让学生养成编程的良好习惯并能用Python 解决一些简单的实际间题。

教学内容:表框图标示算法、Python基础知识、顺序程序设计、列表,元组,字典、选择结构程序设计、for循环、while循环、函数的编写和调用、文件的使用、类的设计和使用、图形用户界面设计和使用、数据库软件开发。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

③《数据结构与算法》课程

教学目标及教学要求:掌握计算机软件系统所必需的数据结构的算法。掌握贯穿全课程的动态链表存储结构,掌握算法设计的动态性和抽象性。学会分析研究计算机加工的数据对象的特征,以便在实际应用中选择适当的数据结构、存储结构和相应算法,初步掌握算法的时间与空间性能分析技巧,并培养复杂程序设计的技能。

教学内容:线性表、栈和队列、串、数组和广义表、树、图、查找算法和排序算法。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、学习成果汇报情况。

④《数据库应用》课程

教学目标及教学要求:本课程旨在介绍数据库系统以及关系数据库系统的基本概念基础理论以及相关知识,同时,系统讲述数据库设计理论和数据库系统的安全性、完整性、并发控制等相关概念和技术, 为学生全面了解数据库技术在管理信息系统中的应用运用数据库技术从事信息管理,开发、运行和维护管理信息系统打下坚实的基础。

教学内容:数据库系统基础、关系数据库、关系模式规范化、数据库设计、数据库与表的管理、数据检索、SQL Server数据安全管理

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

⑤《大数据预处理》课程

教学目标及教学要求:使学生掌握扎实的工程基础知识和计算机专业的基本理论知识,了解软件工程技术专业的前沿发展现状和趋势;具有较强的计算思维能力、算法设计与分析能力、程序设计能力、计算机应用系统的认知、分析、设计和应用的能力;掌握文献检索、资料查询及运用现代信息技术获取相关信息的基本方法。

教学内容:Introduction/Map-Reduce:概述分布计算系统、主要组成和新技术,介绍Map/Reduce方法、 分析常用的设计方法和基本技巧、Finding Similar Sets:介绍典型及常用的相似度的基本算法、Finding Similar Sets:进一步介绍不同的相似度定义、计算方法和适用范围、Burst/Page Rank:介绍分布计算中的不确定性问题,以及该问题如何影响计算结果、介绍Page Rank算法,介绍Page Rank的优化算法。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

⑥《大数据分析与挖掘技术》课程

教学目标及教学要求:数据挖掘是一门新兴的交叉性学科,涵盖了数据库、机器学习、统计学、模式识别、人工智能以及高性能计算等技术。开设本课程的目的,是使学生全面而深入地掌握数据挖掘的基本概念和原理,掌握常用的数据挖掘算法,了解数据挖掘的最新发展、前沿的数据挖掘研究领域、以及数据挖掘技术在不同学科中的应用。

教学内容:数据挖掘概述、数据特征分析与处理、关联规则挖掘、分类算法、聚类算法、异常检测

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、学习成果汇报情况。

    2.专业核心课

①《数据可视化技术》课程

教学目标及教学要求:数据可视化是实现数据价值的重要工具,数据可视化可以将抽象的数字积累转变成为图形、表单等,让普通人可以快速理解数据所代表的情况或趋势。该课程是理论与实践紧密结合的一门核心专业课程,是大数据项目处理流程中最后的一一个环节。通过该课程学习,从一些基础的可视化方法开始,逐渐延伸到可视化技术,其目标是培养学生掌握数据可视化的技术,能够独立完成数据可视化处理工作。

教学内容:数据可视化概述、数据可视化基础、时间数据可视化、比例数据可视化、关系数据可视化、文本数据可视化、复杂数据可视化、数据可视化中的交互、数据可视化评测、数据可视化在各领域中的应用。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

②《人工智能导论》课程

教学目标及教学要求:人工智 能是计算机科学中涉及研究、设计和应用智能机器的一一个分支。本课程是计算机科学与技术,以及有关专业重要的专业方向与特色模块课程之一。通过本课程的开设,使学生对人工智能的发展概况、基本原理和应用领域有初步了解,对主要技术及应用有一定掌握,启发学生对人工智能的兴趣,培养知识创新和技术创新能力。

教学内容:人工智能绪论、知识表示、搜索原理、推理技术、专家系统、机器学习、规划系统、Agent

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

③《并行与分布式计算》课程

教学目标及教学要求:本课程针对以计算机网络为背景的大规模信息处理与计算机应用问题,介绍分布式计算中最基本的分布式算法设计的理论基础、核心思想、基本概念、基本原理、基本方法、基本技术以及一些重要的基础算法,帮助学生掌握分布式算法领域最基本的知识,使他们能够运用这些知识解决分布式计算领域内一些简单问题的分布式算法设计问题,能够对分布式算法的正确性和复杂性进行分析。

教学内容:分布式系统模型、通信协议、路由算法、无死锁的包交换、波动算法与遍历算法选举算法、终止识别、匿名网络、快照、方向侦听与定向网络中的同步、分布式系统中的容错。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

④《NoSQL数据库应用》课程

教学目标及教学要求:掌握NoSQL数据库系统的概念、结构、功能;掌握NoSQL数据库系统设计的原理、方法和技术;掌握NoSQL数据库的优化、可靠性、安全性等知识;掌握设计NoSQL数据库系统的方法,为学生后继课程及实践打下基础。

教学内容:认识HBase、HBase基本原理、HBase管理与编程、MongoDB基础、MongoDB进阶、其他非关系型数据库简介、NewSQL数据库、NoSQL应用案例实战 

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

⑤《数据科学基础》课程

教学目标及教学要求:本课程目的是让学生了解与掌握计算机系统平台、计算机中数据的表示、处理、控制流程等概念性基础层的内容,以及计算机系统与平台领域的大多数内容。重点掌握三个方面的应用技能:如何进行长文档信息的分类与处理、如何在计算机中进行数据的表示和计算、如何进行数据的存储、查询和输出。

教学内容:计算机系统、数据的表示与存储、数据管理示例、算法基础、Python程序设计基础、互联网技术及应用、信息安全。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

⑥《统计分析与建模》课程

教学目标及教学要求:数据分析与建模是一门综合运用分析、试验、量化的手段对生产实践、科学研究、军事工程等各种实际问题建立数学模型并进行求解的应用数学。它系统地介绍数学模型、数学建模和建模过程中的常用方法与实例,为学生今后各专业课程的学习和工作时间打下必不可缺的专业基础。

教学内容:数学软件的使用、线性规划、非线性规划与无约束最优化微分方程与差分方程、网络优化、数据的统计描述、统计分析、计算机模拟、插值与拟合、模糊综合评判、智能算法。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

⑦《深度学习基础》课程

教学目标及教学要求:本课程将全面的介绍近年发展起来的基于神经网络的深度学习技术的基本概念,主要结构,核心方法和关键应用。通过课程的学习,使同学们巩固基础数学及机器学习的基本概念和算法;掌握神经网络基本概念,掌握深度学习中的主要网络结构的基本概念和相关算法,了解具体应用领域的背景知识、应用相关的深度学习技术,掌握通用深度学习网络的参数训练、深度学习的结构变种、序列级深度学习的训练和使用。

教学内容: 机器学习和神经网络的基本概念和算法,深度学习的主流结构及多种不同的激活函数,深度学习的实用算法细节,深度学习的应用例子。

考核方式:课程考核包括课程学习时间、参与研讨和交流情况、作业提交情况和学习成果提交情况。

    3.专业实践课程

①大数据分析案例

实训目标及要求:树立学生对数据分析岗位的认知,讲述数据分析工作的工作原理、所需外部条件、与各岗位间的关系,以及基础技术。帮助学生认知什么是大数据、大数据在具体生活中的应用,了解大数据重要性。

实训内容:应用大数据技术来分析各个公司和各个行业在其他地区的销售额和销售数量,根据大数据来清楚的看清各个行业和公司的差距,了解大数据在现实生活中的应用。

考核方式:课程考核包括课程模拟中的过程性考核、参与研讨和交流情况、学习成果汇报情况。

②海量数据处理

实训目标及要求:通过所学算法和技术,对海量数据进行处理。突出新技术和新方法,使学生通过实践巩固所学知识的同时,挖掘和学习新知识和新方法。

实训内容:针对数据进行收集,清洗,建模,加工等。

考核方式:课程考核包括课程模拟中的过程性考核、参与研讨和交流情况、学习成果汇报情况。

③顶岗实习

实训目标及要求:通过实践提高对大数据行业的行业认知,掌握行业规范,熟悉行业准则,提高工作能力,学做并举,参与或解决实际工作中的实际问题,养成良好职业行为。

实训内容:实习前的调研以及查询相关资料,熟悉行业环境、工作内容,熟悉实习岗位基本情况,进行顶岗实习,完成实习任务,养成良好职业行为,提高岗位技能,能够处理实际工作当中的实际问题,根据岗位工作和实习报告内容要求整理实习资料、完成实习报告。

考核方式:课程考核包括课程模拟中的过程性考核、参与研讨和交流情况、学习成果汇报情况。


招生声明