原文:
www.kdnuggets.com/2022/09/data-analyst-skills-need-next-promotion.html
图片来源:storyset on Freepik
1. Google 网络安全证书 - 快速进入网络安全职业生涯。
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持你的组织 IT
我首先要承认,这个话题在许多不同的平台上已经被反复讨论过了。那么,我能提供什么是之前未曾提及的呢?
好吧,事实是,我比大多数 Medium 作者都要年长。虽然有些人礼貌地称我为“成熟”或“经验丰富”,但实际上我的观点是因为我足够长时间地经历了荧光色和渐变色在条形图上流行的时期。因此,我能提供的是经得起时间考验的建议。
作为分析师,你可能会花费至少 10 倍的时间分析数据,而不是向受众展示信息。因此,图形和其他视觉表现形式很重要,因为它能让即使是没有数据分析训练的人也能更好地理解。通过构建可视化图表,你可以帮助公司决策者一眼就能理解复杂的想法。
那么,如何提升这项技能呢?其实,有许多在线课程和专注于可视化的工具。然而,我不愿意推荐特定的技术或课程,因为世界变化如此之快,我希望提供经得起时间考验的建议。
因此,养成探索他人作品的习惯。建立一个名为“灵感”的书签文件夹,并将其填满博客链接。每周花 15 分钟浏览这些博客,为你的脑袋充电。
我还推荐购买几本书。Edward Tufte 是数据可视化的祖师爷,我也是 Nathan Yau 的粉丝,他在 FlowingData.com 上提供书籍、博客、课程和教程。我将他的两本书,Data Points 和 Visualize This,放在书架上以供灵感。
如何实际创建可视化的机制会随着实践而来。你们中的一些人会爱上 R 或 Python,其他人则会偏爱 Excel 或 Tableau。关键是让你的大脑充满可能性,这样你可以在构建之前想象出你想要的东西。
数据科学家常说“构建机器学习模型的 80% 是准备和清理数据。”然而,这对于数据分析师来说也同样适用。不管实际的百分比是多少,事实是,处理数据的很大一部分时间用于清理数据。
清理数据很重要,因为未清理的数据可能会产生误导性的模式,并导致错误的结论。在我职业生涯早期,我负责提供第一次尝试解决问题的支持电话的百分比。当我向管理层展示结果时,其中一位坚持认为这些数字“没有意义”。当我进一步调查时,我发现电话数据中有一列叫做“status”,有时会填入一个“X”。显然,系统会为测试记录记录一个“X”,这应该被忽略。
数据清理技能随着实践和业务经验的增长而提高,这使得加速学习变得困难。一般来说,像 kaggle.com 或 zindi 这样的网站并不是练习数据清理的最佳场所,因为它们专注于数据科学,数据集通常已经相当干净。另一方面,像 data.ca.gov/
或 data.gov/
这样的政府网站是找到杂乱数据集的好地方。你也可以关注 TidyTuesday 项目,即使你不是 R 用户,也可以找到有趣的数据集,并熟悉实际中清理数据的步骤。
正如我提到的,我不愿推荐特定的工具或技术,因为环境变化非常迅速。可以肯定地说,Python 和 R 会继续存在,但 SQL 是另一个层次。SQL 是数据库的语言,因此学习 SQL 将始终是你操作和研究数据集的最直接方法。
如果你在一家允许下载 Excel 表格的公司工作——可以询问是否可以直接使用 SQL 访问数据库。一旦你熟悉了数据库结构,并能编写 SQL 以获取你想要的数据表示形式,你的工作效率和质量将会提升。
有许多资源可以帮助你提升 SQL 技能,CodeAcademy、Udemy和Udacity都是寻找实践课程的绝佳免费资源。SQL Generator和SQL Beautifier是值得常备的有用链接,可以帮助你学习。如果遇到技术问题,Stack Overflow有一个很棒的社区可以回答 SQL 相关的问题。
在 Rasgo,我们一直在大力回馈数据社区。我们最近的项目是推出免费的SQL Generator,它生成特定数据转换所需的 SQL 语法。我们发现人们在 Google 和 Stack Overflow 上搜索所需的 SQL 语法——浪费了大量本可以用于数据分析的时间。SQL Generator 是一个 SQL 查询模板,可以让你自定义列名和表结构,选择你想执行的操作,然后为你构建各种不同“风格”的 SQL 语法。再也不用担心 DATEDIFF()与 DATE_DIFF()之间的细微差别了!阅读这篇文章了解一些其他有用的在线工具。
批判性思维是最难掌握的技能之一,因为很少有课程或“一刀切”的方法来精通这一技能。批判性思维是一种有意识的努力,旨在挑战那些主宰我们思维的自动心理过程。
批判性思维不是你天生具备的,也不是一旦掌握就永远“开”的技能。相反,批判性思维是一种在你面临重要决策或分析时有意识地激活的能力。它是一种有目的的努力,旨在挑战、质疑和确认假设。
虽然有许多不同的资源可以帮助你提高批判性思维技能,但我想重点关注的是提问。如果你养成写下大量问题的习惯,你将会进行批判性思维。
假设你被要求查看客户流失情况以及是否最近有所改善。停下来问自己一些问题,例如:
-
流失率是如何计算的?为什么是这样?还有其他计算方式吗?
-
从客户的角度来看,什么是流失率?
-
这是否总是客户的选择?
-
哪些因素可能会影响?我可以测量这些因素吗?
-
这项任务的目标是什么?证明、反驳、展示、支持?
-
我可能忽略了什么?是否有已知的假设我无法验证/证明?
注意这条提问线是如何形成层层递进的。回答一个问题可能会引出更多的问题。这完全没问题。这就是要点!
例如,当我在一家电信公司担任分析师时,我被要求查找流失率突然在上个月增加的潜在原因(那时是四月)。我运用批判性思维,列出类似于上述列表的问题。
当我研究流失率计算方式时,我挑战自己考虑是否有其他方法来衡量流失率。长话短说,我发现:
-
公司使用“月末”数据来计算流失率。
-
三月份实际上是一个“财政”月份,涵盖了二月份。
-
二月是一年中最短的月份。
-
使用替代公式计算流失率表明,3 月份的流失率没有增加。
基本上,流失率的公式使得它在一年中最短的月份,也就是三月,会“激增”,这仅仅是因为数学运算的结果。
这个故事的寓意是,批判性思维有时会带你得出意想不到的结论。这也是你今天可以决定改善的东西;这并不是一种神秘的软技能,你必须天生具备!
另一方面,沟通是一项软技能。即使你是世界上最有才华和洞察力的数据分析师,如果你不能与他人沟通,那也无济于事。而且说的“他人”不幸的是指非技术人员。
作为分析师,你跨越两个不同的领域。在一个领域,你必须与同事和其他数据专家讨论技术细节。在另一个领域,你是业务决策者的翻译。你需要提供清晰、高层次的解释,以支持而不是混淆。
开始锻炼这项软技能的一种方法是参与社区活动。现在有很多在线社区、网站和论坛供数据分析师参与。我非常喜欢使用 slack 和 discord 渠道与他人互动,但这些平台通常很快就会冷却。我发现Locally Optimistic和DataTalks.Club是分析师们常聚集的稳定平台。你还可以通过开设博客来练习沟通技巧。Medium是一个很好的起点,在这里你可以发挥创造力并不断练习。
关注最新趋势并提升让你具有市场竞争力的技能仍然很重要。例如,20 年前 VBA、宏、DAX 和 ASP 是提升晋升竞争力的优秀技能。如今,这些技能的相关性较低。希望我提供了一些关于过去 20 年中未曾改变的技能的有用建议,以帮助你避免迷失在细节中。如果你想联系我讨论旧时光,你可以在Locally Optimistic和DataTalks.Club找到我,或直接在Rasgo上联系我。
Josh Berry (@Twitter) 领导 Rasgo 的客户面向数据科学工作,自 2008 年起从事数据和分析职业。Josh 在 Comcast 工作了 10 年,建立了数据科学团队,并是内部开发的 Comcast 功能存储的主要负责人之一——这是市场上最早的功能存储之一。离开 Comcast 后,Josh 在 DataRobot 中对客户面向数据科学的发展起到了关键作用。在业余时间,Josh 对有趣的话题如棒球、F1 赛车、房地产市场预测等进行复杂分析。
原文。经许可转载。