原文:
www.kdnuggets.com/2023/04/get-hired-data-scientist-gpt4-era.html
图片来源:作者
科技世界以空前的速度发展,公司不断努力通过整合生成式 AI 或使用开源模型和数据集开发自己的 AI 来保持领先地位。作为寻求就业的数据科学家,获得多种工具和技能以在就业市场中保持竞争力是至关重要的。
在这篇博客中,我们将讨论成为 AI 数据科学家并被你喜欢的公司录用所需关注的核心主题。我们将重点学习统计学、核心数据科学概念、NLP、提示工程、数据科学作品集、面试准备以及 AIOps。通过掌握这些核心主题,你将能够成功成为 AI 数据科学家,并获得你梦想公司的工作。
即使你可以要求 GPT-4 解释结果,你仍需理解统计术语以得出结论或提出问题。在解释结果之后,你需要制定适合你公司的计划。GPT-4 在处理多个变动因素时难以给出正确答案,这正是我们统计分析知识发挥作用的地方。
照片来源:Kaboompics .com
ChatGPT 和 GPT-4 在制定数据项目的可定制计划方面表现不佳。你需要编写大量后续提示以获取正确的行动计划。即使这样,你也需要在向经理提交之前仔细检查项目计划。所有这些后续提示都需要对数据核心概念有一定了解,如数据摄取、数据清理、数据处理、数据可视化、数据分析和数据建模。
图片来源:作者
即便如此,GPT-4 在调试、研究、提出最新 API 和添加专业代码等方面仍有许多不足。
了解更多关于 20 个初学者核心数据科学概念。
无论是文本生成图像还是文本生成文本的模型,都需要对自然语言处理有专业知识。没有这些知识,你无法对模型进行微调、提高结果,甚至提出自己的解决方案。随着 ChatGPT 的推出,NLP 和强化学习已成为热门职业。
图片来自Hugging Face
大型语言模型可用于文本分类、语言翻译、代码生成、问答、总结等。如果没有 NLP 知识,你将无法进行文本分析或创建特定任务的 AI 应用。
NLP 核心概念对于安全、理解模型架构和数据集也很重要。如果没有这些知识,你很难通过初步的面试阶段。
AI 提示工程正成为所有技术工作者越来越重要的技能。掌握这一技能可以让你编写快速且高效的代码,制定全面的项目计划,有效解决问题,快速适应新技术,并生成高质量的报告和文档。这种 AI 的潜在应用几乎是无限的。
作者提供的图片
AI 提示工程让你更好地与 AI 沟通,无论你是否相信。AI 不是来取代我们,而是来帮助我们在工作中。我们可以在 5 分钟内编写程序或报告。你需要做的唯一事情就是仔细检查结果。
查看 ChatGPT 数据科学备忘单,或通过查看学习 ChatGPT 的最佳免费资源了解提示工程。
从事作品集项目并展示你的作品集资料很重要。你需要在 GitHub 或 DagsHub、Kaggle 和 Huggingface 上拥有优质的数据科学项目。你甚至可以使用像我这样的模板创建自己的网站:Abid 的作品集,或查看我关于 7 个免费平台,帮助建立强大的数据科学作品集的博客。
作者提供的图片
在今天的数字时代,维护在 LinkedIn 上的强大在线存在变得至关重要。正如我通过 LinkedIn 和 GitHub 持续收到的工作邀请所证明的那样,积极参与在线讨论并不断完善你的作品集可以显著提高你被雇佣的机会。一旦你完成了项目,展示你的成果或创建简短教程,并在 Medium 和 KDnuggets 等平台上分享。不要忘记在各种社交媒体平台以及技术专注的 Discord 或 Slack 群组中推广你的项目。
针对数据科学的多个面试环节,你需要为行为、情境、统计学、Python 代码、SQL、NLP、机器学习和数据分析问题做好准备。
图片来自作者
-
通过从事多样化的项目,你可以提高通过面试阶段的机会。查看完整的数据科学项目集合 – 第一部分 和 第二部分
-
复习每个主题的模拟面试。查看完整的数据科学面试集合 – 第一部分 和 第二部分。
-
使用备忘单复习遗忘的数据科学概念。查看完整的数据科学备忘单集合 – 第一部分 和 第二部分。
-
研究公司概况、产品类别和员工,以了解他们在寻找什么,并尝试相应地策划你的回答。
-
展示对最新技术的了解以及使用 AI 改善工作流程的能力。
正如我之前提到的,许多公司正在寻找数据科学家和工程师,将 AI 集成到现有产品中或建立全新的产品。因此,心理上准备好回答与 AI 操作相关的问题至关重要。
图片来自作者
例如:
-
你会如何部署大型语言模型?
-
你知道如何构建、调试和运行数据管道吗?
-
你知道如何使用 docker / kubernetes 吗?
-
你有使用 Azure、GCP 或 AWS 的经验吗?
-
你会如何监控生产中的模型?
-
你会如何更新你的语言模型?
随着公司寻找具有 DevOps 或 MLOps 知识的数据科学家,这些问题变得越来越常见。你可以 通过这门免费课程学习 MLOps。
Abid Ali Awan (@1abidaliawan) 是一位认证的数据科学专业人士,热衷于构建机器学习模型。目前,他专注于内容创作和撰写关于机器学习和数据科学技术的技术博客。Abid 拥有技术管理硕士学位和电信工程学士学位。他的愿景是利用图神经网络为饱受心理健康问题困扰的学生开发一款 AI 产品。