原文:
www.kdnuggets.com/2016/08/become-data-scientist-part-1.html/4
计算机科学 / 软件工程
如果你已经在人工智能/计算机科学领域达到了较高水平,那么你很可能已经处于 B 类数据科学的良好位置。但也有另一条行之有效的路径需要考虑:有经验的软件工程师希望转向数据科学。
1. 谷歌网络安全证书 - 快速进入网络安全职业道路。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织在 IT 方面
软件工程师可能有,也可能没有机器学习经验——这要看具体情况。但无论如何,这种背景显然更适合 B 类数据科学,它需要扎实的软件工程基础。我与澳大利亚联邦银行的高级数据科学家詹姆斯·佩特森(James Petterson,曾为软件工程师)讨论了这个问题,他对此的看法如下:
“很多数据科学工作是软件工程。并不总是指设计健壮的系统,而是简单地编写软件。很多任务可以自动化,如果你想进行实验,你必须编写代码,如果你能做到这一点又快又好,差别会很大。当我攻读博士学位时,我每天必须运行数万次实验,在这种规模下,手动完成是不可能的。拥有工程背景意味着我可以快速完成这项工作,而其他背景的学生在基本软件问题上遇到困难:他们数学很好,但实现他们的想法需要很长时间。”
迪伦补充道:
“良好的软件工程实践在你想要在生产环境中创建一个健壮的机器学习算法实现时是非常有价值的。这包括可维护的代码、共享的代码库以便多人协作、日志记录、能够在生产环境中调试问题、可扩展性等——你需要知道一旦工作量增加,你已经以这种方式架构它,以便在需要时可以进行并行处理或添加更多的 CPU。所以如果你在寻找那些需要将这些东西整合到平台中的角色,而不是进行探索性研究或回答临时业务问题,那么软件工程是非常宝贵的。”
我认为这已经说得很清楚了,但总结一下:如果你是一个对数学有良好兴趣的软件工程师,你有很好的条件成为(B 型)数据科学家,前提是你愿意投入工作来掌握统计/机器学习。
数学
显而易见:数学是所有数据科学领域的基础。因此,合理预期许多数学家现在正在作为数据科学家施展他们的才华。然而,直接从数学领域过渡的人相对较少,这种特殊情况引起了我的兴趣。
一个解释是,数学(包括纯数学和应用数学)的毕业生相比其他相关学科较少,但这并没有讲述全部故事。因此,为了深入了解,我找到了 Boris Savkovic,他是 BuildingIQ 的首席数据科学家(这是一家利用先进算法优化商业建筑能源使用的初创公司)。Boris 拥有电气工程和应用数学背景,并且与许多数学家合作过,他提供了以下见解:
“许多数学家喜欢理论问题、美丽的方程式以及在定理中发现深刻含义,而商业数据科学则是经验性的、混乱而肮脏的。虽然一些数学家喜欢这种情况,但许多人讨厌它。现实世界是复杂的,你不能对一切进行沙盒测试,你必须优先考虑,理解他人的激励,为短期、中期和长期的需求妥协数学和技术,关注递减收益(80/20 原则),并处理深度理论和深度实践之间的一切。简而言之:你必须灵活适应以应对现实世界。这就是商业数据科学的终极目标:寻找更快更好的实际解决方案来赚钱。对于那些有着深厚数学/理论背景并希望把一切理解到最后一度的人来说,这可能非常困难,我看到不少数学博士在从研究/学术界过渡到商业数据科学时遇到了严重困难。”
需要注意的是,Boris 更多地指的是纯数学家,他还补充说他在职业生涯中也与许多优秀的应用数学家合作过。这似乎很有逻辑,因为纯数学更有可能吸引那些对理论充满热爱的人,而不是现实世界的问题。而理论工作不会涉及太多的数据,这对于数据科学来说是相当重要的。
当然也有例外,最终还是取决于个人性格,而不仅仅是一个人所学的内容。显然,许多数学毕业生所学的知识具有高度可转移性,因此掌握特定的统计/机器学习技术应该不会太困难(如果尚未了解的话)。
就适用性而言,大多数数学家可能最适合学习 A 类数据科学的工具和理论。然而,也有数学家研究计算机科学(理论计算机科学本质上是数学的一个分支),因此拥有这种背景的人可能更适合 B 类数据科学。
从这些内容中可以得到一个重要的教训,那就是了解商业数据科学的现实。如果你真正理解这些挑战并且这是你所追求的,那么就去做吧。但是,如果你更喜欢理论而非实际应用,你可能需要重新考虑你的想法。
空白画布
如果你刚刚开始,可能你还在学校,喜欢数学、科学和计算,并且对这个叫做数据科学的领域感兴趣,好消息是:你可以在没有先前背景的情况下选择你的道路。而且现在有很多具体的数据科学课程,涵盖计算机科学和数学/统计学。只是要做好长期奋斗的准备;你不会一夜之间成为数据科学家,正如我们将在第二部分中看到的,我们将探讨:如何学习。
简历: Alec Smith 是数据科学和工程领域的专业招聘人员。作为一家招聘机构的招聘人员,他提供了商业分析的独特跨部门视角,并利用这种观点撰写有关数据科学、技术和招聘的各种话题。原籍英国,他目前在澳大利亚悉尼工作。关注 Alec 的 Twitter @dataramblings。
这篇文章最初发表于 Experfy 的博客。
相关:
-
数据科学家的意义是否如你所想?
-
构建数据科学投资组合:机器学习项目第一部分
-
2016 年数据科学家职位最佳地点