也就是说,大数据技术的意义不在于掌握数据,而在于专业化处理数据,通过“加工”数据以实现“增值”,更好地辅助决策。快速增长的社会需求,导致人才巨大的需求缺口,为了填补这一领域人才空白,高校纷纷开设数据科学与大数据技术专业,为社会培养和输送人才。大数据专业作为一门基础技术类学科,进一步深造对本科生来说,是必选项。
目录 | CONTENTS:
专业认知
培养方案
知名高校
未来规划
就业前景
入门书籍
第一章 专业认知
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。这些数据需要进一步处理,才能具有更强的决策力、洞察发现力和流程优化能力,以便实现资源高增长和多样化。这样的信息,才能变成资产。
也就是说,大数据技术的意义不在于掌握数据,而在于专业化处理数据,通过“加工”数据以实现“增值”,更好地辅助决策。
当前,中国互联网正在迈向人工智能时代,大数据已应用到我们生活的方方面面。从打车软件、网购软件、导航软件,无不体现大数据运算的能力。
快速增长的社会需求,导致人才巨大的需求缺口,为了填补这一领域人才空白,高校纷纷开设数据科学与大数据技术专业,为社会培养和输送人才。
就专业学科而言,大数据的本质是什么?
大数据=统计学 数学 计算机
第二章 培养方案
大数据专业学什么?大数据专业全称为数据科学与大数据技术,这是一门交叉学科,以统计学、数学、计算机为三大支撑性学科。
生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。
为了学好该门学科,还需学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等。
一、需学课程(参考)
1、专业基础课:
计算机
数学分析
高等代数
普通物理
数学与信息科学概论
数据结构
数据科学导论
程序设计导论
程序设计实践
2、专业核心课:
离散数学
概率与统计
算法分析与设计
数据计算智能
数据库系统概论
并行体系结构与编程
计算机系统基础
非结构化大数据分析
3、专业选修课:
数据科学算法导论
数据科学专题
数据科学实践
互联网实用开发技术
抽样技术
统计学习
回归分析
随机过程
二、培养目标
作为最年轻的本科专业之一,本专业旨在培养社会急需的具备大数据处理及分析能力的高级复合型人才。
1、培养掌握计算机科学、大数据科学与信息技术的基本理论、方法和技能人才;
2、培养具备一定大数据科学研究能力与数据工程实施基本能力的人才;
3、培养掌握大数据工程项目规划、应用、管理及决策人才;
4、具有大数据工程项目设计、研发和实施能力的复合型、应用型卓越人才。
三、学习大数据专业应具备的能力
1、扎实的数学功底
由需学课程可知本专业对学生的数学基础有一定要求,光通识课部分就设置了三门数学课。学科基础课里还有离散数学、数字逻辑、数学系统。
2、坚强的意志
与计算机专业同样,大数据专业非常注重实践。学生需要独立编写程序,对心浮气躁的学生来说,不经历一番磨练很难静下心来。
3、自学能力
大数据专业只是一门工具,要解决实际问题,还需要具备相关行业的专业知识,比如对从事金融行业数据挖掘工作的学生来说,还必须对金融产品及用户有所了解。
第三章 知名高校
一、选择名校的理由:
进入好学校就读是每个同学的心愿,但为什么要进入名校就读,无非是以下几个方面:
学校软硬件资源
学校声誉与雇主评价
社会需求
这表现在:
1、更好的师资、更多的经费、更优的科研项目等;
2、更优异的校风、校友、发展机会等;
3、更多的保研、实践机会等;
4、更有机会申请国外名校实验室进行研究。
关于本科阶段申请国外前沿实验室,名校的这项优势并不广为人知。教育部有个面向本科生的海外暑期科研项目,但只面向包括清华、北大、浙大、南大在内的985院校。
在求职阶段,相关企业更愿意接受有名校背景的求职者。这意味着同等条件下更强的学习能力和专业素养,以及科研能力。
二、国内知名高校
第一梯队:北京大学、复旦大学
第二梯队:中南大学、北京理工大学
第三梯队:山东大学、同济大学
第四梯队:哈尔滨工业大学等
三、国外知名高校
哥伦比亚大学
加州大学伯克利分校
斯坦福大学
麻省理工学院
卡耐基梅隆大学
......
第四章 未来规划
本科毕业以后,学生面临三个选择:国内升学、出国深造,直接就业。
大数据专业作为一门基础技术类学科,进一步深造对本科生来说,是必选项。原因有二:
一方面,大数据类专业的本科生大多只涉及到专业大类的轮廓,没有足够的知识、很难进行高端工作。
另一方面,在一个具体专业领域进行深入地学习和研究,接受更多的专业知识和技能的学习和训练,一般需要在研究生阶段,甚至博士阶段进行。所以,为了成为研究型人才,物理学专业还得深造。
继续深造一般有以下途径:
一、国内升学
国内升学分为:考研和保研。如果是自己考研,这里没什么好说的,只要努力学习就可以。但保研,讲究一定的策略。
名校,或985以上院校,只要GPA在院系前60%,没有挂科记录的同学都有获得推免资格。其中,GPA前50%大概率都能本校保研成功。
所以,对高中生来说,考上大学不是学习的结束,而是新的开始,排名当然是越靠前越好,但所谓强中更有强中手,你努力别人也努力,要想获得好的成绩,需要付出艰辛的努力。
特别提醒:
如果有机会读985院校,尽量读这类院校,至少保研的机会多很多。当有机会保研,一般就不要选择考研,原因是考研压力大,并且会浪费很多机会成本。
二、出国深造
该专业留学首推美国,美国高校设置的数据科学专业,包括数据提取、数据挖掘、预测分析等。知名高校有哥伦比亚大学、加州大学伯克利分校、斯坦福大学等。
三、出国准备
如果打算出国留学,以下五项需及早规划:
成绩排名
科研经历和成果
英语成绩
推荐信
海外暑期科研
申请文书
1.成绩排名
这里成绩排名没什么好说的。就是认真对待每一门学科成绩,如果某门成绩不够理想,宁愿申请重考。
2.科研经历和成果
衡量科研经历的指标:
①文章发表(科研文章)
②科技竞赛
无论是发表文章,还是参加竞赛,都不短期内能够做好,因此,得提早规划,什么时候开始呢?一般须从大二就开始,甚至刚进校就进行规划。
所以需要尽量早点进入教授团队实验室,在师兄和导师的带领下做课题,少走弯路。这有两个目的:
①发表高质量的文章
②获取导师推荐信
就获取导师推荐这件事,也要求大家尽量早一点参与教授项目,如果人家对你不熟悉,如何推荐你呢?
特别提示:
本科生申请直接读博士时,一般都需要面试。面试内容一般包括但不限于:
①科研经历
②导师认知
③学术观点
3.英语成绩(托福、GRE)
托福和GRE考试这个也没有更多的需要说,但时效需要提示:托福成绩两年有效,GRE成绩五年有效。所以有需要的,大家要算好时间。
4.推荐信
这里特别强调:大牛的推荐信往往能起到重要且决定性的作用。但如何获得大牛的推荐呢?
①自己的授课老师
②科研老师、实习老师
③业界高端人士
所以,平时和这人获得交集很重要。
5.海外暑期科研
一般来说,名校的大三学生有机会暑假到国外名教授的实验室以研究助理的身份从事2-3个月的科研活动。
这里有交换生项目、官方合作项目、国内导师内推以及学业专业类的项目,以帮助学生实现以上目标。
6.申请文书
申请文书,有些同学可能会请专门的机构来做,但是与其这样,还不如自己来做,因为有沟通的时间成本,已足以抵得上自己花费的时间了。
特别提示:
无论是保研、考研、还是出国深造,什么时候开始准备呢?从时间安排来看,大二就要开始,如果打算走保研这条路,这里再次强调,千万不要挂科。并且必须保持对英语学习的热情。
无论是国内升学,还是国外深造,以下工作在校期间必须得参与:
①争取参与科研
打算本校保研的学生,早一点参与相关老师和实验室的科研项目,与学长学姐经验分享等,至少混个脸熟。
②参加保研目标校的夏令营
对打算异校保研的,多参加公共类活动,比如,教育部每年举办的夏令营,以认识更多外校的教授,这个关注本校信息即可(当然异校保研对成绩要求高一点,一般在年级排名全10%以内)。
③参加一些跟本专业有关的有技术含量的竞赛
大数据专业全国性的比赛有:
CCF大数据与计算智能大赛;
全国大学生数据技能竞赛。
直接就业将在下一章就业前景详细说明。
第五章 就业前景
一、行业地位
未来时代将不是IT时代,而是DT时代,也就是数据科技时代。
从公布的“中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要”来看,国家对大数据发展作出重要部署,所以这方面专业人才在未来必定是炙手可热。
无论是金融、互联网,还是医疗、教育、城市规划等行业,都需大量的大数据人才。具体表现在三个方向:
大数据系统研发类人才;
大数据应用开发类人才;
大数据分析类人才。
二、职业分类
数据科学与大数据技术专业可细分为以下十大职位:
1、ETL研发;
2、Hadoop开发;
3、可视化(前端展现)工具开发;
4、信息架构开发
5、数据仓库研究
6、OLAP开发
7、数据科学研究
8、数据预测(数据挖掘)分析
9、企业数据管理
10、数据安全研究
三、相关企业(参考)
蚂蚁集团
滴滴打车
百度金融
北京宇信科技集团股份有限公司
深圳亚联发展科技股份有限公司
曙光信息产业股份有限公司
北京四维图新科技股份有限公司
普元信息技术股份有限公司
广东奥飞数据科技股份有限公司
深圳万润科技股份有限公司
广东紫晶信息存储技术股份有限公司
四、升学方向
主要方向有:
计算机科学与技术
计算机系统结构
计算机软件与理论
计算机应用技术
科学与信息技术(清华、北大、复旦、北京航空航天大学等少数学校开设)
第六章 入门书籍
一、《大数据时代》——维克托•迈尔•舍恩伯格
这本书展示了谷歌、微软、IBM、苹果、twitter、VISA等大数据先锋们具价值的应用案例。
作为大数据系统研究的先河之作,作者围绕“要全体不要抽样、要效率不要绝对精确、要相关不要因果”三大理念,以实际商业和学术案例,向读者剖析了万物数据化和数据应用的巨大价值。
二、《大数据竞争力如何成为真正的数据分析型企业》
这本书为读者展示了大数据分析在企业中的应用价值和未来前景。
在长期观察和访谈调研基础上,作者以丰富的案例阐释了数据分析型企业的竞争优势和核心特征,以及企业人力资源管理、财务管理、供应链管理、客户管理对数据分析技术的依赖与实践方法。
这本书可作为公司管理者借助大数据分析构建竞争优势的实践手册,也可指导相关人员对各类商业数据进行分析。