Skip to content

Latest commit

 

History

History
237 lines (119 loc) · 11.5 KB

complete-mlops-study-roadmap.md

File metadata and controls

237 lines (119 loc) · 11.5 KB

完整的 MLOps 学习路线图

原文:www.kdnuggets.com/2022/12/complete-mlops-study-roadmap.html

完整的 MLOps 学习路线图

图片由作者提供

所以下一版的学习路线图是 MLOps - 机器学习、DevOps 和数据工程的结合体。目标是以可靠和高效的方式部署和维护机器学习系统。那么,如何成为一名 MLOps 工程师呢?


我们的前三个课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持你所在组织的 IT


1. 基础

如果 MLOps 是机器学习、DevOps 和数据工程的结合体 - 你可以想象 MLOps 的基础也是这些子领域的基础。

那么基础是什么呢?

Python

如果你选择 Python 作为你的编程语言,以下是一些推荐的课程:

作为 MLOps 工程师,强烈建议使用脚本语言,因为你需要在高水平上自动化流程。Python、Go 和 Ruby 是你可以选择的流行脚本语言的例子。

SQL:

数学:

2. 机器学习算法和库

作为一名 MLOps 工程师,你的日常任务将围绕机器学习算法展开,因此理解你所使用的模型至关重要。你还需要了解相关的库和框架,以便在你的角色中取得成功。

机器学习算法资源:

机器学习库资源:

还有更多的库,但这些是你通常会使用的最受欢迎的库。

3. 数据库

从数据工程师的角度来看,数据库及其管理系统是 MLOps 工程师角色和职责中的重要元素。为了以可靠和高效的方式维护机器学习系统,你需要数据库来帮助你完成这一任务。

以下是一些资源:

4. 模型部署

作为 MLOps 工程师,你需要学习如何部署你的模型。大型公司通常使用云平台来托管他们的应用程序,如 AWS、GCP 和 Microsoft Azure。因此,你很可能也会这样做,因此我强烈建议你对这些平台有良好的理解,因为作为 MLOps 工程师,你肯定会使用它们。

以下是一些资源来帮助你:

5. 实验跟踪

对于一些数据工作者来说,他们的最终目标是实现模型部署。然而,作为一名 MLOps 工程师,实验跟踪至关重要。实验跟踪允许我们管理所有实验及其组件,如参数、指标等。这使我们更容易组织每个实验的组件,重现过去的结果并记录所有内容。

作为一名 MLOps 工程师,你应该了解可以用来跟踪实验的不同工具。我将列出最受欢迎的几种:

6. 元数据管理

元数据是关于数据的数据,管理这种数据可以帮助你更好地理解、分组和排序数据以供其他用途。从模型中生成元数据可以用于训练参数、评估指标、测试管道输出等。

在工作流程生命周期中,糟糕的元数据管理可能导致信息冲突、对数据的不信任以及成本增加。

这里有一些资源可以帮助你更好地理解:

7. 数据和管道版本管理

数据版本管理是对随着时间推移创建的不同版本的数据进行存储。数据随时间变化的原因有很多,例如数据科学家测试是否能够提高机器学习模型的效率或信息流动。数据版本管理的优势和必要性从商业角度来看,通过使消费者了解数据集是否有更新版本来提供帮助。

以下是用于数据版本管理的流行工具列表:

8. 模型监控

模型监控阶段在模型部署之后,是一个如其名所示的过程——监控模型。你需要注意模型退化、数据漂移等问题,以确保模型保持良好的性能水平。

这里有一些资源可以帮助你:

9. 项目

你应该对成为 MLOps 专业人员所需的技能有良好的理解和深入的知识。一旦掌握了这些技能,下一步就是通过项目进行测试——这些项目随后可以作为你的作品集的一部分。

这里有一些项目想法:

实践你的技能并完善它们是这里的主要目标!

10. 面试

现在我们已经准备好迎接面试了。在准备面试时,目标是准备、准备,然后放松!对于技术角色,有很多东西需要记住,有时紧张会导致你忘记一切。所以我总是建议人们保持冷静,享受这个阶段——享受你付出的所有努力,并证明解决这些挑战是轻而易举的!

这里有一些资源可以帮助你:

总结

由于 MLOps 涉及机器学习、DevOps 和 IT——有许多资源可以帮助你成为最成功的 MLOps 工程师。查看这篇文章的其他版本,来帮助你:

  1. 完整的数据科学学习路线图

  2. 完整的机器学习学习路线图

  3. 完整的数据工程学习路线图

尼莎·阿雅 是一名数据科学家和自由职业技术写作人员。她特别关注提供数据科学职业建议或教程以及与数据科学相关的理论知识。她还希望探索人工智能如何/可以促进人类生命的持久性。她是一个热衷学习者,寻求拓宽她的技术知识和写作技能,同时帮助指导他人。

更多相关主题