Skip to content

Latest commit

 

History

History
83 lines (42 loc) · 5.76 KB

maximize-productivity-data-scientist-organizing.md

File metadata and controls

83 lines (42 loc) · 5.76 KB

通过组织来最大化你的数据科学家生产力

原文:www.kdnuggets.com/2022/03/maximize-productivity-data-scientist-organizing.html

通过组织来最大化你的数据科学家生产力

Kaleidico 来自 Unsplash

有时感觉一天的时间不够用。当你正在完成一个任务时,另一个请求可能会出现。如果你处理数据,原本希望用几个小时完成的任务可能会变成几天。

你的 8 小时工作日可能会变成 9 小时、10 小时,有时甚至更多。你开始花费如此多的时间在工作上,以至于忽视了个人生活。

有很多文章解释了如何提高你的工作生产力;然而,数据科学家的生活却是不同的。组织自己将为你节省大量时间和精力,使你的工作日更加顺畅;让你能按时完成工作。

我们都会遇到这种情况;大多数时候我们做得很好,但有时工作太多导致我们偏离了规律,组织工作也就无从谈起。我总是对人们说,关于组织自己;如果花费不到 10 分钟,马上去做。

当涉及到在数据导向环境中组织自己时,可能会感到不堪重负。文件、笔记本和文档繁多,容易变得混乱。以下是一些帮助你在处理数据时进行组织的提示。

给文件起具有描述性的名称

当你在浏览成千上万的数据集时,这将为你节省大量时间。很多时候文件会丢失,因为团队成员不记得文件名;然而,如果你给文件起具有描述性的名称,Mac 或 Windows 上的快速搜索可以解决这个问题,节省你的时间。

以下是给文件命名时需要考虑的一些要点,无论是在项目开始前还是思考新系统时。

文件名称需要:

  1. 一致性

  2. 对你和你的同事有意义

  3. 容易访问

在开始一个新项目或重新考虑现有系统之前,如果你的团队能就以下几个方面达成一致,将会很有帮助:

  • 词汇 – 确保大家使用统一的语言

  • 标点符号 – 需要仔细考虑标点符号,如大写字母、连字符和空格,以及它们的使用效果。

  • 日期 – 这将帮助你区分项目,使你能够回顾旧项目。例如:YYYY-MM-DD

  • 顺序 - 讨论并达成共识,确定哪个元素应该优先,以便文件可以轻松找到。例如,按日期、项目代码和客户排序文件名。

创建文件夹

将所有的数据集、笔记本和输出集中在一个地方会很快变得混乱。为特定项目创建文件夹,并包含子文件夹,将帮助您区分不同的内容,也能更容易找到文件等。向团队其他成员解释这一过程,并确保每个人使用相同的系统,将解决缺失数据集、笔记本等问题。

如果团队成员想回顾一个旧项目,他们将能够舒适地做到这一点,因为项目将被划分,并附有描述性文件名。如果每个人都遵守程序,他们将不需要咨询其他团队成员这些文件的位置。

文档

作为数据科学家,您每天会处理大量的数据集,这些数据集可能彼此不同。您可能在进行一个项目时遇到与以前的项目类似的问题;然而,您不记得问题是否相同或解决方案是什么。

文档,文档,文档。我们的脑袋很棒,但我们不能保证记住所有事情。然而,如果我们记得把所有东西写下来;至少我们有可以参考的东西。

在每个项目开始时记录数据是一个好的实践;这可能包括研究或可能影响项目的问题。随着项目的进展,继续添加信息对理解问题和解决方案非常重要,同时也能了解下次应该避免的事项。这是改善组织工作流程的重要因素。

有几种方法可以将文档添加到您的数据中:

  • 嵌入文档 - 这是指一个文档,通常结构为文本文件或二进制文件,嵌入到另一个文档中。

  • 支持文档 - 这是附带数据的独立文件。它提供了背景、解释或关于如何使用数据的说明。

通过组织提高数据科学家的生产力

Sigmund 通过 Unsplash

一旦这些数据科学项目工作流程的元素被修正并且所有团队成员遵守,您将开始看到生产力的变化;这将使您能够专注于其他紧迫的问题。这些可以是数据整理、修复错误等。

Nisha Arya 是一位数据科学家和自由职业技术写作员。她特别感兴趣于提供数据科学职业建议或教程,以及围绕数据科学的理论知识。她还希望探索人工智能如何能够促进人类寿命的不同方式。她是一个热衷学习者,寻求拓宽自己的技术知识和写作技能,同时帮助指导他人。

更多相关主题