Skip to content

Latest commit

 

History

History
103 lines (52 loc) · 6.7 KB

winning-game-plan-building-data-science-team.md

File metadata and controls

103 lines (52 loc) · 6.7 KB

为建立你的数据科学团队制定的制胜计划

原文:www.kdnuggets.com/2018/09/winning-game-plan-building-data-science-team.html

c 评论

作为 Hitachi “数据科学部会”的副主席,我在 Hitachi 面临的最令人兴奋的挑战之一是帮助领导 Hitachi 数据科学能力的发展。我们有一个目标,到 2020 年希望培训并投入使用的人数,因此确实感受到紧迫感。我喜欢这种紧迫感,因为它有助于清除变革的阻碍和抗拒。

我开始这个任务时写了一篇标题为“数据集成和数据工程有什么区别?”的博客,阐述了传统数据集成和现代数据工程之间的区别(见图 1)。


我们的前三个课程推荐

1. Google 网络安全证书 - 快速进入网络安全领域的职业轨道。

2. Google 数据分析专业证书 - 提升你的数据分析技能

3. Google IT 支持专业证书 - 支持你的组织的 IT


图片

图 1: 数据集成与数据工程

但那个博客只涉及了数据工程师的角色。为了实现“数据科学部会”的目标——即更有效地利用数据和分析来优化关键业务和运营流程,减轻合规和安全风险,发掘新的收入机会,并创造更具吸引力和差异化的用户体验——我们需要考虑三个关键角色,以及这三个关键角色之间的互动,这些角色构成了数据科学社区的完整面貌。我们需要了解数据工程师、数据科学家和业务利益相关者的职责、能力、期望和技能。

研究数据科学三位一体

我们从研究硅谷领先数据科学组织的数据工程师和数据科学家的招聘职位开始了这个任务(感谢 John!)。我们随后创建了一个图形,突出了这些角色的重点和能力,以及这些角色之间的互动——数据科学能力的维恩图(见图 2)。

图片

图 2:数据科学能力 Venn 图表

数据科学能力的 Venn 图表确定了三个关键数据科学角色的关键目标和能力。数据科学创新发生在这三种角色的交集处:

  • 假设开发(明确你想要实现的目标以及如何衡量进展和成功),

  • 数据货币化(识别、验证、评估和优先排序业务和运营用例)和

  • 治理(运营化和采用)。

备注:我将在未来的博客中详细探讨这些创新点及其在推动数字化转型和数据货币化中的作用。

研究的支持细节可以在图 3 的视力图表中看到。

图片

图 3:定义数据科学职责和工具

这是一个很好的基础,帮助我们了解我们需要招聘和/或发展的技能。然而,图表本身还不够。我们现在需要将这些研究转化为可操作的内容。

数据科学能力 Spider 图表

我们的下一步是将 Spider 图表叠加在数据科学能力 Venn 图表上。然后,我们可以利用 Venn 图表不仅评估数据科学社区的当前能力,还可以基于此制定个性化的发展计划,以提高三个角色中的数据科学能力。

图 4 显示了一个例子,即我们希望为其开发数据工程技能的初级数据科学家进行的这种映射练习。

图片

图 4:样本数据科学家发展计划

再次,我们可以使用数据科学能力的 Venn 图表 Spider 图来评估该个人在所有三个维度上的当前能力,然后制定个性化的培训计划或课程,以促进他们在不同维度上的进步。

图 5 显示了使用 Spider 图表来提高业务利益相关者的数据科学和数据工程意识的另一个示例。

图片

图 5:样本业务利益相关者数据科学发展计划

虽然我们的目标不是将业务利益相关者转变为数据科学家,但我们确实希望培训业务利益相关者“像数据科学家一样思考”。 这样,业务利益相关者就能理解如何与数据科学家和数据工程师更好地合作,挖掘客户、产品、服务和运营的洞察,从而推动业务成功。 详情请参见博客“像数据科学家一样思考系列”了解如何创建“数据科学公民”。

下一步是细化区分初级、中级到高级数据科学家和数据工程师的梯度,然后创建相应的课程和内容来达到这些目标。  你好,全球学习团队!

构建数据科学团队总结

数据科学是一个由数据工程师、数据科学家和业务利益相关者组成的团队运动。 就像一支棒球队不能仅靠游击手和捕手来有效运作一样,一个数据科学计划必须清楚地阐明数据工程师、数据科学家和业务利益相关者的角色、责任和期望。

如果你的组织目标是更有效地利用数据和分析来推动商业模式和数字化转型,那么你不能仅靠一支全是投手的团队赢得比赛。 对吧,Alec?

相关:

  • 数据集成和数据工程之间的区别是什么?

  • 伟大的数据科学家不仅仅是跳出框框思考,他们重新定义了框框

  • 识别可能更好的预测变量

更多相关主题