Skip to content

Latest commit

 

History

History
161 lines (81 loc) · 11.3 KB

edison-data-science-framework.md

File metadata and controls

161 lines (81 loc) · 11.3 KB

EDISON 数据科学框架用于定义数据科学职业

原文:www.kdnuggets.com/2016/10/edison-data-science-framework.html

作者:Yuri Demchenko,阿姆斯特丹大学,荷兰

摘要

数据科学技术的有效使用需要新的能力和技能,并要求新的职业来支持研究数据生命周期的所有阶段,从数据生产和输入到数据处理、存储以及获得的科学结果的发布和传播。本文介绍了 EDISON 数据科学框架(EDSF),包括建立未来数据科学专业人员可持续毕业和培训所需的概念性、指导性和政策性组件。


我们的前三大课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业。

2. Google 数据分析专业证书 - 提升你的数据分析能力

3. Google IT 支持专业证书 - 支持你所在组织的 IT


介绍

现代研究需要新的专业人员,这些人员能够支持研究数据生命周期的所有阶段,从数据生产和输入到数据处理、存储以及科学结果的发布和传播,这些可以统称为数据科学职业系列。未来的数据科学家必须具备数据挖掘与分析、信息可视化与沟通、统计学、工程学和计算机科学等方面的知识(并获得相关的能力和技能),并在未来的工作和专业领域中积累经验。尽管数据科学家是数据相关职业系列中的关键职业,其他职业则专注于数据生命周期的其他阶段和支持基础设施。

文章描述了所提出的 EDISON 数据科学框架(EDSF)的主要组件,该框架作为定义数据科学职业系列的基础。还提供了有关数据科学能力框架(CF-DS)和数据科学知识体系(DS-BoK)的更多详细信息,这些对于定义一致且可定制的数据科学课程至关重要。

EDISON 数据科学框架

图 1 下方展示了 EDISON 数据科学框架(EDSF)的主要组件,这些组件为数据科学职业的发展提供了概念基础(包括对相关文档的参考):

  • CF-DS – 数据科学能力框架(CF-DS,2016)

  • DS-BoK – 数据科学知识体系(DS-BoK,2016)

  • MC-DS – 数据科学模型课程(MC-DS, 2016)

  • DSP – 数据科学专业档案和职业分类(DSP, 2016)

  • 数据科学分类法和科学学科分类

提出的框架为数据科学专业生态系统的其他组成部分提供了基础,例如

  • EDISON 在线教育环境(EOEE)

  • 教育和培训市场及目录

  • 数据科学社区门户(CP),还包括个别能力基准测试和个性化教育路径构建的工具

核心数据科学能力和专业档案的认证框架

EDISON 数据科学框架组成部分

图 1: EDISON 数据科学框架组成部分。

数据科学能力框架和知识体系

数据科学能力框架(CF-DS)是 EDISON 数据科学框架的基石,并用于定义数据科学知识体系(DS-BoK)和数据科学模型课程(MC-DS)等组成部分。CF-DS 的定义符合欧洲电子能力框架(e-CF3.0),并提供了将数据科学相关能力和技能扩展到 e-CF3.0 的建议。

图 2 说明了主要的 CF-DS 能力组及其相互关系:

  • 数据分析,包括统计方法、机器学习和业务分析

  • 工程:软件和基础设施

  • 学科/科学领域能力和知识

  • 数据管理、整理、保存

  • 科学或研究方法(针对研究职业)和业务流程管理(针对业务相关职业)

确定的能力领域为定义数据科学相关工作的教育和培训项目、技能再培训和专业认证提供了更好的基础。对科学研究方法和技术的了解使数据科学家职业不同于所有以往的职业。

数据管理和研究方法(或业务流程管理)被放置在两个外圈,以强调这些能力和知识是所有数据科学专业人员所需的。建议在所有数据科学课程中都包括数据管理(或特别是研究数据管理)和研究方法。

数据科学能力组(针对一般或研究导向的职业)

(a)数据科学能力组(针对一般或研究导向的职业)。

数据科学能力组(针对业务导向的职业)

(b)面向业务的职业的数据科学能力组。

图 2: 确定的数据科学能力组之间的关系,分为(a)一般或研究导向和(b)商业导向的职业/角色

CF-DS 为数据科学知识体系(DS-BoK)的定义提供了基础,该知识体系涵盖了专业人员执行其职业所有数据相关过程所需的知识。知识体系通常定义了课程内容,并通过可以为特定学员组定义的学习成果与 CF-DS 相关联。

数据科学知识体系与模型课程

根据 CF-DS 能力组定义,DS-BoK 应包含以下知识领域组 (KAG):

  • KAG1-DSDA: 数据分析组,包括机器学习、统计方法和商业分析

  • KAG2-DSENG: 数据科学工程组,包括软件和基础设施工程

  • KAG3-DSDM: 数据管理组,包括数据策展、数据保存和数据基础设施

  • KAG4-DSRM: 科学或研究方法组

  • KAG5-DSBP: 业务流程管理组

高校可以使用 DS-BoK 作为参考,定义他们需要在课程中覆盖的知识领域,这取决于他们在研究或行业中的主要需求组。领域特定的知识可以作为学术教育的一部分或作为研究生的专业培训在工作场所获得。普遍认为,“新鲜”的数据科学家需要 2-3 年才能熟练掌握其职业技能。

提出的数据科学模型课程为构建可定制的数据科学课程提供了两个基本组件:(1)基于 CF-DS 能力定义学习成果(LO),包括不同熟练程度的区分,例如使用布卢姆分类法,(2)定义映射到目标职业组学习成果的学习单元(LU),这些单元需要根据现有的学术学科分类,如计算机科学分类(CCS,2012),来定义。

进一步发展

所展示的 EDSF 包括由供应和需求双方的主要利益相关者实施的组件:大学、职业培训机构、标准化机构、认证和认证机构、公司及其人力资源部门,以成功管理数据相关工作的能力和职业发展。提出的 DS-CF 已在众多研讨会和社区论坛上广泛讨论。它已经被少数与 EDISON 项目相关的机构使用。发布的供公众评论的 DS-BoK 和 MC-DS 文档将需要进一步的开发和专家验证,以定义具体的知识领域。这将通过涉及相关知识领域的专家,并与 IEEE、ACM、DAMA、IIBA 等专业社区合作来完成。该项目将与合作伙伴和领先大学一起进行 DS-BoK 和 MC-DS 的试点实施,并收集从业者的反馈。所有 EDISON 项目产品均在创意共享许可下公开提供。

致谢

EDISON 项目在 H20202 资助协议编号 675419 下由欧洲委员会支持。本文是 SciDataCon2016 会议论文的更新版,最初发布于 www.scidatacon.org/2016/sessions/98/poster/75/

简介: Yuri DemchenkoYuri Demchenko 是阿姆斯特丹大学系统与网络工程领域的高级研究员。他的主要研究领域包括大数据和数据密集型技术、电子科学、云计算和跨云架构、基于云的服务设计、一般安全架构以及面向云服务和数据中心应用的分布式访问控制基础设施。他负责协调欧洲资助的 EDISON 项目,该项目旨在为欧洲研究和工业建立数据科学职业的基础。

参考文献

Andrea Manieri 等, 2015,《数据科学专业揭秘:EDISON 项目如何促进数据科学家广泛认可的职业形象》,发表于第七届 IEEE 国际云计算技术与科学会议(CloudCom2015)的论文集中,2015 年 11 月 30 日至 12 月 3 日,加拿大温哥华

CCS, 2012,2012 年 ACM 计算分类系统 [在线] www.acm.org/about/class/class/2012

CF-DS, 2016,《数据科学能力框架(CF-DS)》。EDISON 草稿 V0.6,2016 年 3 月 10 日 [在线] www.edison-project.eu/data-science-competence-framework-cf-ds

Demchenko, Y., E.Gruengard, S.Klous, 2014, 构建有效的大数据课程的教学模型。 见于第 6 届 IEEE 国际云计算技术与科学会议及研讨会 (CloudCom2014),2014 年 12 月 15-18 日,新加坡

DS-BoK, 2016, 数据科学知识体系 (DS-BoK)。EDISON 草稿 V0.1,2016 年 3 月 20 日 [在线] www.edison-project.eu/data-science-body-knowledge-ds-bok

DSP, 2016, 数据科学专业档案定义 (CF-DS)。EDISON 草稿 v0.1,2016 年 7 月 11 日 [在线] www.edison-project.eu/data-science-professional-profiles-dsp

eCFv3.0, 2014, 欧洲 e-能力框架 3.0。适用于所有行业领域的 ICT 专业人员的共同欧洲框架。CWA 16234:2014 第一部分 [在线] ecompetences.eu/wp-content/uploads/2014/02/European-e-Competence-Framework-3.0_CEN_CWA_16234-1_2014.pdf

EDISON 项目:构建数据科学职业 [在线] www.edison-project.eu/

ESCO, 2016, ESCO (欧洲技能、能力、资格和职业) 框架 [在线] ec.europa.eu/esco/portal/#modal-one

MC-DS, 2016, 数据科学模型课程 (MC-DS),EDISON 草稿 v0.1,2016 年 6 月 11 日 [在线] www.edison-project.eu/data-science-model-curriculum-mc-ds

NIST, 2015, NIST SP 1500-1 NIST 大数据互操作框架 (NBDIF):第 1 卷:定义,2015 年 9 月 [在线] nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST.SP.1500-1.pdf

相关:

  • 分析、大数据、数据科学、机器学习的证书与认证

  • 分析、数据挖掘和数据科学的证书

  • 分析、数据科学、机器学习的教育

更多相关主题