Skip to content

Latest commit

 

History

History
89 lines (45 loc) · 7.21 KB

data-scientist-challenges.md

File metadata and controls

89 lines (45 loc) · 7.21 KB

成为数据科学家的挑战

原文:www.kdnuggets.com/2022/02/data-scientist-challenges.html

数据科学家:挑战

Christopher Gower 通过 Unsplash

全球组织都在寻找新的方法来组织、处理和释放数据的全部潜力,并将其转化为高价值的商业洞察。因此,我们可以说数据是新的石油。


我们的前三个课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业道路。

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持你组织的 IT 需求


希捷 预计到 2025 年,生成的数据量将达到 163 泽字节;是 2017 年数据量的十倍。因此,你可以想象数据科学家的需求会飙升。2012 年,LinkedIn 发布数据科学家的增长率达到 650%。这一职业在最佳工作排名中名列前茅,并且薪资最高。

每个行业都能从数据科学中受益,因此没有理由让组织错过这一机会。哈佛商业评论将数据科学标记为 21 世纪“最性感”的职业。

尽管这是 21 世纪“最性感”的职业,但每个职业都有其挑战。你可能会想,一个需求如此高的工作,挑战和问题应该会少一些,因为这些岗位在组织中至关重要。然而,按照金融时报的说法,许多公司似乎未能创造出能够应对数据专家激增的职位。许多数据专家正在努力晋升或实现职业愿望。根据 Stack Overflow 的调查,13.2%的数据科学家在寻找新的工作,因为他们对目前的角色不满意。

那么,为什么会这样?数据科学家面临的挑战是什么?

1. 数据准备

数据很少是完美或干净的,这导致数据科学家花费近 80%的时间来清洗和准备数据,参考Forbes。这篇文章的标题是《最耗时、最不愉快的数据科学任务》,因此你可以想象为什么 13.2%的数据科学家在寻找新工作。如果你大部分时间都花在提高数据质量,使其准确一致,然后再进行分析;这可能会变得非常疲惫、单调和耗时。

减少准备数据所花费的时间以及数据科学家缺乏动力的一个方法是采用新兴的 AI 驱动的数据科学技术,如增强分析。增强分析自动化手动数据清洗和准备任务,使数据科学家能够更高效地工作,并将时间花在他们更愿意做和喜欢做的分析等其他任务上。

2. 数据安全

数据科学家:挑战

FLY:D via Unsplash

随着组织转向使用云数据管理,网络攻击变得越来越突出。这可能对处理政府数据和需要保护的公共信息的组织来说是一个非常大的问题。

造成的问题有:

  1. 机密数据被滥用

  2. 由于网络攻击的增加,监管标准已经扩展了数据同意和利用流程。这给处理数据的数据科学家带来了更多的工作。

为了减少这些问题的发生,组织应该实施额外的安全措施和先进的机器学习驱动的安全平台来保护数据。同时确保组织遵循数据保护规则和法规,以避免审计和罚款;这些会给组织带来不良声誉。

3. 多数据源

当数据不易获得时,会花费大量时间搜索数据、验证数据的可靠性以及手动输入数据。这可能导致错误、重复以及整体数据质量差,从而做出错误的决策。

拥有一个集成多个数据源的集中平台,为数据科学家和其他可能需要数据的人提供即时访问。这为数据科学家节省了大量时间和精力,改善了整体工作流程。

4. 理解业务问题

在收集数据、整理数据和进行任何形式的分析之前;数据科学家必须理解需要解决的问题。他们是数据的科学家,因此他们将重新构建数据以寻找解决方案;所以他们对问题有一个良好的理解是至关重要的。

理解业务问题是数据科学工作流程的第一阶段。如果工作流程的第一阶段经过正确思考,当数据科学家进入数据准备和分析阶段时,它始终可以作为参考点。

5. 全才

许多组织存在一个很大的误解,认为数据科学家能做所有事情。作为数据科学家,你需要收集和清洗数据、构建模型和分析数据。如上所述,80%的数据科学家时间用于清洗和准备数据,因此可以想象,在此之后,构建模型和分析数据所投入的努力。

对数据科学家要求过高会导致数据团队运作无效。他们会失去动力,被工作量压倒,可能会想要辞职。其他同事需要理解每位数据科学家的角色、优点和缺点。此外,这种误解认为数据科学家非常聪明,能做任何事情,能够完成分配的任务。

结论

数据科学家将继续成为市场上最受欢迎的职业之一。随着数据科学家数量的迅速增加,要在这个角色中取得成功,不仅需要卓越的技术技能,还需要非技术技能,如理解组织的需求,以一种能够向利益相关者证明分析结果有用且能为公司带来好处的方式进行沟通。

尼莎·阿娅 是一名数据科学家和自由撰稿人。她特别关注提供数据科学职业建议或教程以及数据科学理论知识。她还希望探索人工智能如何/可以促进人类寿命的不同方式。她是一个热衷学习者,寻求拓宽自己的技术知识和写作技能,同时帮助指导他人。

更多相关主题