原文:
www.kdnuggets.com/2017/09/data-science-imposter-syndrome.html
我不是一个真正的数据科学家。
我从未使用过深度学习框架,比如 TensorFlow 或 Keras。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你组织的 IT 工作
我从未接触过 GPU。
我没有计算机科学或统计学学位。我的学位是机械工程学,真是奇怪。
我不知道 R。
但我还没有放弃希望。阅读了一些职位发布后,我发现成为真正的数据科学家只需五个博士学位和 87 年的工作经验。
如果这听起来很熟悉,你要知道你并不孤单。你不是唯一一个担心自己还能伪装成数据科学家的时间有多长的人。你不是唯一一个对下一个面试被笑出来而做噩梦的人。
冒名顶替综合症是一种感觉,认为你领域中的其他人都比你更有资格,你永远不会被雇佣,或者如果已经被雇佣,那你是招聘过程中的一个错误。尽管统计上看这种感觉不太可能,但我们中的大多数人感到低于平均水平。根据我与同事的交谈,我估计我们中有 9 成在某一时刻遭受过冒名顶替综合症。(如果这对你来说完全陌生,我建议你阅读 Kruger 和 Dunning 的“无能而无意识”一书。)
即便是伊沃克有时也会感到像冒名顶替者。(图片由 Diane Rohrer 提供。)
真正的数据科学家是什么样的
“数据科学”是一个激发了很多兴奋的术语,就像一个磁铁,吸引了许多相关的子领域。我们称之为数据科学的领域仍然相对年轻,但对于个人来说,已经过于广泛,无法在每个角落都成为专家。根据我的经验,通才的数据科学独角兽是一种神话中的生物。我们中的任何人都无法涵盖所有领域。那么我们该如何继续?
前进的道路有两条:通才和专家。
一个好的通才
-
对数据科学的每个部分都具有表面上的熟悉感,
-
认识到所有的术语和技术词汇,
-
对解决特定问题所需的工具和专长有一个良好的概念,并且
-
在技术评审中提出有见地的问题。
一个好的专家
-
深入理解一个领域,
-
能够将他们的专业领域解释给非专家,
-
理解不同方法之间的权衡,
-
了解当前的研究和新工具,并且
-
可以快速使用他们的工具来产生高质量的结果。
一名通才不一定了解算法的细节和工具的使用技巧。他们会告诉你数据清洗很关键,但可能无法列举替代缺失值的方法之间的权衡。他们会告诉你 Spark 是加速计算的好方法,但可能无法建议你使用最佳设置。
一名专家不一定对自己领域之外的内容了解很多。他们会知道如何在 5 亿个数据点上运行线性回归的最佳架构,但可能无法解释朴素贝叶斯分类器。他们会敏锐地把握平方损失、铰链损失和逻辑损失之间的权衡,但可能无法从 Hive 表中查询数据。
另一种描述通才和专家的方法是“广度”与“深度”。他们都是技术精通的,但他们的专长分布不同。我们每个人都是部分通才和部分专家。随着职业的发展,你会找到最适合你的混合方式。
这种区分在招聘数据科学家时也很有帮助。具体要求具有深度神经网络研究经验或金融数据可视化背景的求职者,将比要求“全栈”数据科学家更有效地吸引符合需求的申请者。
如何证明你是一个真正的数据科学家
传统上,我们通过高级学位来确立在某个领域的资格。不幸的是,对大多数人来说,数据科学领域的高级学位非常稀缺。我们没有一张纸作为盾牌,当有人质疑我们的资格时。因此,我们该怎么做呢?我们如何回答批评者、面试官、同事,甚至是我们内心最严厉的声音?
以木工为例。假设你想在厨房里安装一个定制的橱柜。三位木匠前来询问这项工作。第一位木匠展示了她的证书。她说:“我在城市顶级的橱柜制造商那里做了七年的学徒。”第二位木匠打开了她的工具箱,说:“我的凿子是最新设计的,没有人能比我的刨子更锋利。”第三位木匠递给你一个小盒子,樱桃色且光滑完美。当你用指尖拉动把手时,一个抽屉无声地滑出。她说:“这是我做的。”
认证、工具和作品集都是建立资历的热门方式。我不会争论哪一种优于另一种,但作品集对数据科学家特别有效。认证较少且尚未标准化。列出我们使用过的算法和计算机语言并不能传达我们对它们的熟悉程度或我们能用它们做什么。 构建项目 向非技术观众展示了我们能为他们做什么,并向技术面试官和同事展示了我们的专业知识。当然,这不能保证你会在第一次面试中得到工作。但即使没有,这也是正常的。 继续面试。
成为真正的数据科学家的感受
请注意,无论是全能型还是专门型的数据科学家都有很多不知道的事情。这意味着即使是真正的数据科学家也会大部分时间感到迷茫。我们的项目负责人会问我们不知道答案的问题。 同事会轻松地谈论我们从未听说过的算法。队友会写出我们完全无法解读的代码。文章会引用我们不知道存在的“热门”子领域。档案论文会抛出我们如同象形文字般难以理解的方程式。实习生会指出我们推理中的根本缺陷。这没关系。你没有做错。这没关系。
我们的目标不是积累答案,而是提出更好的问题。如果你在提出问题并利用数据寻找答案,那么你就是一名数据科学家。就这样。
原文。经许可转载。
相关内容:
-
KDnuggets 顶级博主:与顶级数据科学家 Brandon Rohrer 的访谈
-
数据科学口袋指南
-
如何获得数据科学工作:一个非常具体的指南