原文:
www.kdnuggets.com/2023/06/data-scientists-still-needed-age-generative-ai.html
使用稳定扩散技术创建的图像
恰好两年前,我写了一篇名为“数据科学家将在 10 年内灭绝”的观点文章。令我惊讶的是,这篇文章成为我在 Medium 和 KDnuggets 上阅读量最高的文章之一。然而,反响却是两极分化的。这篇文章引发了我成年生活中收到的最多批评。我预言了 21 世纪最性感(也是最需求)工作的消亡,而我的同行们对此提出了异议,但我接受了反馈,生活继续前行。快进到现在,两年的时间带来了如此大的变化。ChatGPT 风靡全球,与此同时,特定角色将被淘汰的叙述被更大的议题所掩盖——人力资本在各个行业中的过时。
1. 谷歌网络安全证书 - 快速通道进入网络安全职业。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织 IT
革命似乎一夜之间发生了。但我们这些密切关注深度学习进展的人都知道,事实并非如此。ChatGPT 是数十年研究的积累,不可思议地汇聚成了一个不起眼的聊天机器人。ChatGPT 成功的核心在于它使 AI 民主化。掌握代码和拥有深厚的技术知识不再是进入门槛,前沿深度学习的可及性已超越了学术研究和大科技公司,任何有 wifi 和电子邮件地址的人都可以触及。
我从未想过我们会处于如此速度、规模和性质的技术革命的边缘。在 LLM 和文本到图像模型之前,生成式 AI (GAI) 很大程度上与 Ian Goodfellow 的生成对抗网络 (GANs) 同义。它被誉为近年来 AI 研究的重大贡献之一,体现了使用一对神经网络生成合成的、照片级真实的图像。我们这些曾经使用过 GAN 的人都知道,它们训练起来 notoriously difficult,即使实施正确,当时的应用场景也有限。因此,生成深度学习带来了最新一轮的进展,这更令人惊叹。
那么,为什么 ChatGPT(及其 GAI 伙伴)会使数据科学家面临灭绝的边缘呢?让我们回顾一下两年前的原始论点:
-
仅仅能复述代码和使用软件包的能力将不再定义数据科学家,因为低代码/无代码解决方案已经变得越来越普遍。
-
工作和分析数据的能力将成为许多角色的假定技能,就像计算技能和 MS Office 知识一样。
-
在这种范式下,能够解决现实世界问题的领域专家将会表现出色。数据科学将成为他们工具箱的一部分。
-
鉴于上述情况,通才数据科学家将被领域专家取代。
鉴于此,我们可以看到,GAI 几乎促进了上述每一个点。它可以直接从文本提示中生成代码、分析数据集和查询结果。对能够使用 ChatGPT 的 AI 准备专业人员的需求已经开始渗透到职位描述中,我们知道尽管使用 GAI 可以带来生产力的提升,但 AI 仍然容易产生幻觉,它仍可能出错,这进一步强调了深厚领域专业知识在应对这些情况中的必要性。总之,这还不到 10 年,只用了两年。
然而,数据科学家灭绝并不意味着从事数据科学的人工会变得过时,实际上恰恰相反。当我们回顾历史时,在过去 200 年里,我们经历了几次技术革命,包括蒸汽动力、大规模生产和个人计算等。每一次技术革命都使我们的生产力超过上一次,因为我们的角色和与技术的关系不断演变,这一概念在经济理论中根深蒂固(Solow 增长模型)。在当前环境下,企业正在创造和捕获比以往更多的数据,因此数据科学技能将始终有需求,但未来的数据科学家不会被称为数据科学家,他们将以产品经理、营销专家或投资分析师等名称出现。数据科学家灭绝了,数据科学万岁。
免责声明:观点和意见仅代表作者本人。
Michael Wang 是一位拥有超过 10 年行业经验的投资与数据科学从业者,涉足金融科技、投资、交易及教学等多个领域。他是 WhyPred 的首席顾问及创始人,该公司是一家将金融市场专业知识与人工智能和机器学习相结合的分析咨询公司。