原文:
www.kdnuggets.com/2021/09/3-important-lessons-data-science-career.html
评论
照片由 Mantas Hesthaven 在 Unsplash上提供。
1. Google 网络安全证书 - 快速进入网络安全职业轨道
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持你所在组织的 IT
我相信这些经验教训之所以重要,是因为它们对拥有成功的数据科学职业至关重要。阅读完这些内容后,你会意识到,成为一个优秀的数据科学家远不只是构建复杂模型。
话虽如此,这里是我在数据科学职业中学到的三大最重要的教训!
图像由作者创建。
我注意到的一点是,几乎所有的数据科学课程和训练营都强调和详细说明了项目生命周期中的建模阶段,而实际上,这只是整个过程的一个小部分。
如果你在工作中构建一个初步的机器学习模型花费了一个月的时间,你可以预期在此之前花一个月理解商业问题,并在之后花时间记录和宣传项目。
不仅建议你在构建模型之前和之后完成这些步骤,而且这对你的项目成功至关重要。
让我们深入探讨每一项的重要性:
-
商业理解:理解当前的商业问题对你的成功至关重要。例如,如果你在构建一个机器学习模型,你应该知道模型的预测目标是什么,谁会使用它,如何实际使用它,评估模型的指标是什么,等等。你必须花时间去理解关于业务目标的所有细节,以创建一个适用的模型。
-
文档:虽然我同意文档编写不如处理数据和构建模型那样令人兴奋,但你需要为你的代码、构建的任何表格以及模型的构建过程提供清晰且简洁的文档。这一点非常重要,以便你自己或其他人可以在使用模型或修复模型时轻松查阅这些资源。
-
社交化:社交化很少被提及,但如果项目没有被业务部门使用,它们将不会成功。社交化你的项目意味着将其展示给相关利益相关者,解释其价值以及如何使用它们。你能向更多的利益相关者推销你的想法,你的数据产品被采用的可能性就越大,你的项目就会越成功。
这三个步骤有什么共同点?它们都是一种沟通。实际上,我认为良好的沟通是数据科学家和高级数据科学家之间的区别所在。
当我开始学习数据科学时,我尝试在没有学习基础知识的情况下直接学习最复杂的概念。
经过多年的经验,我意识到基础知识足以帮助你在职业生涯中走过 80% 的路程。为什么?更简单的解决方案总是会胜出。它们更易于理解、实施和维护。一旦简单的解决方案向公司展示了其价值,只有在那时你才能考虑更复杂的解决方案。
那么,基础知识到底是什么?
经过三年的工作,我深信掌握 SQL 对于成功的职业生涯至关重要。SQL 不是一个难以学习的技能(即,SELECT FROM WHERE),但要做到精通确实是一个难度大的技能。SQL 对于数据处理、数据探索、数据可视化(构建仪表板)、报告生成和数据管道构建至关重要。
如果你想掌握 SQL,请查看我的指南:一个完整的 15 周课程来掌握数据科学中的 SQL
对基础描述性统计和推断统计有良好的理解也是非常重要的。
描述性统计 允许你以简单的方式总结和理解你的数据。
推断统计 允许你基于有限的数据(样本)得出结论。这对于构建解释性模型和 A/B 测试至关重要。
Python 主要用于执行 EDA 和特征工程。也就是说,这两个步骤也可以使用 SQL 完成,所以这点需要记住。我个人喜欢将 Python 纳入我的技术栈,因为我发现用 Jupyter Notebook 进行 EDA 比在 SQL 控制台或仪表板上更容易。查看:探索性数据分析的详尽分步指南
构建,测试,迭代,重复。
通常,花较少的时间在模型上以便将初始版本投入生产,并从那里开始迭代,总是更好。为什么?
-
在初始模型上分配较少时间会激励你提出更简单的解决方案。正如我在本文中早些时候所说,简单的解决方案有多个好处。
-
你越快提出一个概念验证(POC),就能越快收到他人的反馈来改进它。
-
商业需求不断变化,因此如果你能更早地部署你的项目,你更可能成功。
我想表达的观点是不要急于推进你的项目,而是要快速部署它们,以便你可以收到反馈,进行迭代和改进**你的项目。
相关: