原文:
www.kdnuggets.com/2019/12/data-science-curriculum-roadmap.html
(额外作者列表)
评论
我们在收到来自学术伙伴的多个请求后,冒险建议了一条课程路线图。作为一个团队,我们的大部分时间都花在了行业中,尽管我们中的许多人也曾在学术领域度过了一段时间。以下是一些广泛的建议,每种实施都不可避免地需要大量调整。考虑到这一点,以下是我们的课程推荐。
1. Google 网络安全证书 - 快速进入网络安全职业轨道。
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持你的组织在 IT 方面
我们想强调的是,准备学生将知识应用于行业环境中的单一最重要因素是以应用为中心的学习。使用现实数据回答实际问题是最佳准备方式。它将抽象概念与实际操作结合起来,同时教会数据机制和数据直觉,这在孤立情况下是不可能做到的。
以此为基础,我们提供了一系列主题,以便为数据科学实践做好准备。
数据科学和数据中心的学术项目类型与我们在工作中识别的主要技能领域非常相似。有些项目强调工程,有些项目强调分析,还有些项目强调建模。这些的区别在于,分析关注我们能从数据中学到什么,建模关注估计我们希望拥有的数据的问题,而工程则关注如何使一切运行得更快、更高效、更稳健。
也有一些通用数据科学项目,在一定程度上涵盖了所有这些领域。此外,还有相当多的领域特定项目,教授特定领域的工程、分析和建模技能的子集。
这些项目模型的课程推荐会有所不同。然而,它们都会包含一些核心主题。分析、工程和建模中心的项目将有各自额外的主题领域。一般课程将包括一些分析、工程和建模课程的内容,但可能不会深入到相同的程度。学生通常会从这三个领域的任何组合中自行选择课程。
领域特定项目的课程看起来与一般项目类似,唯一不同的是,主题,甚至整个课程,将专注于该领域的特定技能。例如,一个侧重于精算的 数据分析项目可能包括保险公司最常用的软件工具、时间序列和稀有事件预测算法,以及在保险行业中被广泛接受的可视化方法。学生可以通过基于实际领域特定数据的项目来最佳地实践他们的技能。强烈建议参与实际项目或实习。在设计这些项目时,机构也可能考虑提供跨学科的学位和项目。领域特定项目通常结合了来自多个部门或学院的课程。
这是我们建议在每个领域中包含的主要主题,并列出了一些特别重要的子主题。
-
编程
-
文件和数据操作
-
脚本编写
-
绘图
-
-
基本数据库查询
-
概率与统计
-
概率分布
-
假设检验
-
置信区间
-
统计显著性
-
-
代数
-
数据伦理
-
数据解释与沟通
-
演讲
-
技术写作
-
针对非技术受众的数据概念
-
-
高级统计
-
实验设计
-
统计功效
-
A/B 测试
-
贝叶斯推断
-
因果推断
-
-
微积分
-
应用
-
成本效益权衡
-
实用意义
-
-
可视化
-
软件工程
-
协作开发
-
版本控制与可重复性
-
数据流处理
-
生产工程
-
流水线建设
-
调试和单元测试
-
-
软件系统与基础设施
-
并行与分布式处理
-
客户-服务器架构
-
云计算
-
-
计算复杂性
-
数据结构
-
数据库
-
设计
-
数据建模
-
高级数据库查询
-
-
数据管理
-
安全
-
隐私
-
治理
-
合规
-
-
线性代数
-
监督学习
-
分类
-
回归
-
-
无监督学习
-
聚类
-
降维
-
-
神经网络
-
多层感知器
-
卷积神经网络
-
循环神经网络
-
-
特征工程
-
自然语言处理
-
计算机视觉
-
算法设计
-
优化
请注意,对于每个主题和子主题,有许多有效的方法可以将其拆分为课程。您机构的最佳方式将取决于许多因素,包括学期长度、每堂课的小时数、现有的部门界限、讲师的可用性以及学生预期的学习速度。这些建议假设一个为期两年的硕士课程,主要目标是为学生准备就业和持续职业发展,尽管它们也可以根据其他项目的范围进行扩大或缩小。
应该重申的是,注重应用的教学将更好地为学生准备职业职位。理论越是扎根于具体实例中,具体技能在解决更大问题的背景下被练习得越多,学生对如何运作以及在哪里应用的理解就越深刻。
原文。经许可转载。
相关:
-
2019 年 5 大著名深度学习课程/学校
-
应对数据科学技能日益增长的需求
-
我在数据科学硕士课程中学到的 7 件事