原文:
www.kdnuggets.com/2021/11/salary-breakdown-top-data-science-jobs.html
评论
由Thought Catalog拍摄的照片,来源于Unsplash [1]。
-
介绍
-
机器学习工程师
-
自然语言处理工程师
-
数据工程师
-
数据科学家
-
概要
-
参考文献
当查看数据科学家的薪资和数据科学角色时,很明显,数据科学中存在不同、更具体的方面。这些方面与独特的职位相关,特别是机器学习操作、自然语言处理、数据工程以及数据科学本身。当然,还有比这些更具体的职位,但这些可以给你一个大致的了解,如果你获得其中一个职位的话。我选择这四个角色也是因为它们可以很好地分开,几乎就像有一个聚类算法发现了彼此之间最不同的职位,但这些职位也在同一个领域。接下来,我将讨论平均基本工资的低高范围、相应的资历水平、用于确定这些数字的估计数量,以及每个角色所需的技能和经验。
由Possessed Photography拍摄的照片,来源于Unsplash [2]。
机器学习工程师往往将已研究和构建的数据科学模型应用于生产环境,通常涉及软件工程以及机器学习算法知识。可以想象,薪资水平相当不错。这个估计来自glassdoor [3]。
基于大约
1,900
份提交的薪资数据,范围广泛如下:
-
低 — ~ $86,000
-
平均 — ~$128,000
-
高 — ~$190,000
如你所见,任何职位都有一个范围,经验越多,薪资越高也就不足为奇。除了工作经验年限之外,你工作的州、所用的技能以及公司也会影响最终薪资 — 对于所有这些职位也同样适用。为了获得更多细节,我们可以查看不同的资历等级,以便了解级别提升与薪资之间的关系:
-
机器学习工程师 L2 ~ $128,000
-
高级机器学习工程师 L3 ~ $153,000
-
机器学习领军人物 L4 ~ $166,000
下面是一些个人经验中你可以在机器学习职位中使用的技能:
-
SQL/Python/Java (有时)
-
算法知识 — 无监督与监督分类、时间序列、回归以及将它们封装在一起的流行库
-
部署平台和工具 — AWS、Google Cloud、Azure、Docker、Flask、MLFlow 和 Airflow — 部署模型并与数据科学家合作组成自动化流程
图片来自 Patrick Tomasso 在 Unsplash [4].
通常被称为 NLP 工程师,这个角色通常专注于将数据科学模型或机器学习算法应用于文本数据。一些 NLP 工作的例子包括对大量文本进行主题建模、语义分析以及聊天机器人代理。虽然如此,你也可以预期有相当不错的薪资 — 然而,这个薪资水平可能会低于机器学习工程师,因为这个角色的包容性较差,更多地集中于数据科学中的某一特定主题。这个估算来源于 glassdoor [5]。
基于大约
*20*
份提交的薪资,有一个广泛的范围如下:
需要注意的是,报告的薪资金额相对较低,因此对这个范围要持保留态度,但尽管如此,对这个薪资仍然有很高的信心。
-
低 — ~ $80,000
-
平均 — ~$115,000
-
高 — ~$166,000
所有这些金额都低于机器学习岗位,但与大多数其他职位相比仍然相当高。
下面是一些个人经验中你可以在自然语言处理工程师职位中使用的技能:
-
NLTK — 自然语言工具包库
-
TextBlob
-
spaCy
-
文本清理和处理(去除标点符号、去除停用词、隔离词根、词干提取和词形还原)
-
语义分析 — 一个例子是分析客户的正面和负面评价
-
主题建模 — 一个例子是发现大量文本中的共同话题,比如客户评论的相同内容,但不仅仅是好的或坏的评论,而是可以分析以改进产品的评论主题:“差质量”与 90%的负面评论相关。
-
分类 — 使用像随机森林这样的算法,将传统的数值特征与描述等文本特征结合起来,创建一个将数据分组的模型 —— 比如客户细分
照片由 Caspar Camille Rubin 拍摄,来源于 Unsplash [6]。
也许更常见的角色,并且更与数据科学相关的是数据工程。然而,这个角色依然对数据科学工作至关重要,有时数据科学家需要了解大部分数据工程师的知识,因此我会将其包括在本分析中。一些数据工程的例子包括创建一个 ETL 任务,存储最终用于数据科学模型的数据,以及自动存储模型结果,进行查询优化。这个估算也来自于 glassdoor [7]。
根据大约 ~
6,800
提交的薪资,以下是广泛的范围:
-
低 — ~ $76,000
-
平均 — ~$111,000
-
高 — ~$164,000
这个范围更接近自然语言处理工程师的角色,但它可能与实际的日常工作中的职位最为不同。还需要注意的是,这个职位涉及的估算更多。
以下是一些个人经验中可以在数据工程师职位中运用的技能:
-
ETL — 提取、转换和加载
-
ELT — 提取、加载和转换
-
获取将被存储在数据库或数据湖中的数据,这些数据可以用于数据分析、机器学习算法训练,并用于存储数据科学模型的结果
-
SQL 查询优化 — 为公司节省时间和金钱
照片由 Daria Nepriakhina 拍摄,来源于 Unsplash [8]。
最后但同样重要的是数据科学家的角色。虽然这个角色看似最为通用,但实际上也可以很具体,通常主要包括模型构建过程——有时还需具备数据工程师和机器学习工程师的操作要求,并且有时——但也不常见——可能涉及自然语言处理的专长(通常如果重点是 NLP,那么数据科学家会以此为职称——但并非总是如此)。这个角色的变动性也更大,因此我们也可以预期较宽的范围。这个特定的估计也来源于glassdoor[9]。
基于约 ~
*16,200*
提交的薪资数据,以下范围非常广泛:
-
低 — ~ $81,000
-
平均 — ~$115,000
-
高 — ~$164,000
出乎意料地低于预期,这个角色与本分析中的大多数角色相当。话虽如此,它可能是对异常值最真实且最稳健的,因为它的薪资数据提交量远远最多。
这里是一些个人经验中你可以期望在数据科学职位中使用的技能:
-
SQL, Python, R
-
Jupyter Notebooks
-
可视化——Tableau、库和包、Google Data Studio、Looker 等……
-
定义问题陈述、获取数据集、特征工程、模型比较、模型部署以及结果讨论
-
示例项目——创建一个分类器,根据多个特征对公司产品进行分组,从各种来源获取数据,使用 SQL 和 Python,部署模型并解释结果及其对公司的影响
尽管这些角色有很多相似点和不同点,但它们的薪资范围也如此。四个薪资中有近三者相似,只有一个明显不同。那个角色是机器学习工程师——为什么会这样? 我理解是,这个角色需要了解大多数数据科学概念,尤其是它们的输出,以及涉及到的部署软件工程——这需要了解和运用大量知识,因此,既包含软件工程又包含数据科学的角色薪资自然较高。除了每个数据科学角色的薪资分解——或与数据科学类似的角色,还有你可以期望使用的技能,以便更好地了解该角色及其与薪资金额的关系。
总结一下,我们分析了以下四个职位,以及你可以期望使用的技能:
* Machine Learning Engineer
* Natural Language Processing Engineer
* Data Engineer
* Data Scientist
我希望你觉得我的文章既有趣又有用。如果你同意这些数据和范围,请在下面评论——为什么或者为什么不?你认为某个角色特别偏离现实吗?你还能想到哪些数据科学角色,其薪资结构会有所不同?还有哪些因素会影响角色的薪资?
这些薪资数据报告来自美国,因此以美元计价。我与这些公司没有关联。
请随时查看我的个人资料和其他文章,也可以通过 LinkedIn 与我联系。
[1] 图片由 Thought Catalog 拍摄,发布在 Unsplash,(2018)
[2] 图片由 Possessed Photography 拍摄,发布在 Unsplash,(2018)
[3] Glassdoor, Inc., 机器学习工程师薪资,(2008–2021)
[4] 图片由 Patrick Tomasso 拍摄,发布在 Unsplash,(2016)
[5] Glassdoor, Inc., 自然语言处理工程师薪资,(2008–2021)
[6] 图片由 Caspar Camille Rubin 拍摄,发布在 Unsplash,(2017)
[7] Glassdoor, Inc., 数据工程师薪资,(2008–2021)
[8] 图片由 Daria Nepriakhina 拍摄,发布在 Unsplash,(2017)
[9] Glassdoor, Inc., 数据科学家薪资,(2008–2021)
个人简介: Matthew Przybyla 是 Favor Delivery 的高级数据科学家,以及一名自由技术作家,专注于数据科学。
原文。经许可转载。
相关内容:
-
数据科学家与数据工程师薪资对比
-
数据科学家与机器学习工程师 – 他们的技能有哪些?
-
2021 年数据科学家最需要的技能