原文:
www.kdnuggets.com/2020/01/data-science-interview-study-guide.html
评论
作者 Ben Rogojan,SeattleDataGuy。
1. Google 网络安全证书 - 快速进入网络安全职业轨道。
2. Google 数据分析专业证书 - 提升你的数据分析水平
3. Google IT 支持专业证书 - 支持你的组织的 IT 工作
数据科学面试,如同其他技术面试一样,需要充分的准备。为了确保你能够应对统计学、编程和机器学习的连续问题,需要涵盖多个主题。
在开始之前,我想分享一个提示。
我注意到公司进行的数据科学面试有几种类型。
一些数据科学面试非常以产品和指标为导向。这些面试更多关注像你会使用什么指标来展示你应该改进产品的地方等产品问题。这些问题通常与 SQL 和一些 Python 问题搭配出现。
另一种数据科学面试往往混合了编程和机器学习。
如果你不确定将面对哪种类型的面试,我们建议询问招聘人员。有些公司非常擅长保持面试的一致性,但即便如此,团队也可能会根据他们的需求有所不同。以下是我们注意到的一些公司数据科学面试的例子。
Airbnb — 产品导向,指标诊断,指标创建,A/B 测试,大量行为问题,以及家庭作业材料。
Netflix — 产品感觉问题,A/B 测试,实验设计,指标设计
Microsoft — 编程为主,二叉树遍历,SQL,机器学习
Expedia — 产品、编程、SQL、产品感觉、关于 SVM、回归和决策树的机器学习问题
由于这种差异,我们创建了一个清单,以跟踪你学习过的主题领域以及你仍需覆盖的内容。
首先,确保你能解释基本的数据科学算法。
-
逻辑回归 — 视频
-
A/B 测试 — 视频
-
决策树 — 博客
-
SVM — 博客
-
如何使用 SVM — 视频
-
主成分分析:PCA — 博客
-
主成分分析 — 视频
-
AdaBoost — 博客
-
AdaBoost — 视频
-
机器学习中的梯度提升算法的温和介绍 — 博客
-
梯度提升第一部分:回归主要思想 — 视频
-
K-Means 聚类 — 智能数学 — 视频
-
贝叶斯网络 — 博客
-
神经网络 — 博客
-
降维算法 — 博客
-
kNN 算法如何工作 — 视频
在大型科技公司,偶尔会收到概率或统计学的问题。虽然这些问题不一定需要复杂的数学,如果你有一段时间没有考虑独立和依赖概率,那么复习基础公式是很有帮助的。
概率视频
概率测验
概率面试问题
这些问题大多数都与我们被问过的问题相似,或者直接取自于glassdoor.com。
-
一个骰子被掷了两次。第一次掷出 3 和第二次掷出奇数的概率是多少?
-
在任何 15 分钟的时间间隔内,有 20%的概率能看到至少一颗流星。在一个小时的时间段内看到至少一颗流星的概率是多少?
-
爱丽丝有两个孩子,其中一个是女孩。另一个孩子也是女孩的概率是多少?你可以假设世界上男性和女性的数量相等。
-
你可以将 12 个人分成 3 个 4 人团队的方式有多少种?
统计学预测
统计学概念
统计学是一个广泛的概念,所以不要过于纠结于这些视频的细节。相反,确保你能在表面层面解释这些概念。
统计学测验后
产品意识是数据科学家必备的重要技能。了解在新产品上应该测量什么及其原因,有助于确定产品是否表现良好。有趣的是,有时候某些指标朝着你期望的方向发展,可能并不总是好事。人们在你的网站上花费更多时间,可能是因为网页加载时间更长或其他类似的用户面临问题。这就是为什么指标很棘手,以及你测量什么是重要的。
产品与实验设计概念
产品与指标问题
-
一个重要指标下降,你会如何深入分析原因?
-
你会使用什么指标来量化 YouTube 广告的成功(这也可以扩展到其他产品,如 Snapchat 滤镜、Twitter 直播、Fortnite 新功能等)
-
你如何衡量一个产品/产品功能的成功或失败
-
Google 发布了其搜索算法的新版本,他们使用了 A/B 测试。在测试过程中,工程师发现新算法没有正确实施,返回了不相关的结果。在测试过程中发生了两件事:
-
治疗组的人比对照组执行了更多的查询。
-
治疗组的广告收入也更高。
为什么治疗组的人比对照组执行了更多的搜索?这里可能有不同的答案。
问题 4 来源于 Zarantech; 我们非常喜欢这个问题,并认为它很好地展示了事情如何可能出错。
仅仅因为数据科学并不总是需要大量编程,并不意味着面试官不会要求你遍历二叉树。因此,确保你问问面试官预期会遇到什么问题。不要被这些问题吓倒。做几个练习,以防在面试中感到意外。
视频前问题
视频前问题
在查看关于数据结构和算法的视频内容之前,考虑尝试以下问题。这将帮助你了解需要关注的重点。
数据结构视频
算法视频
字符串操作
学习后问题
现在你已经学习了一些内容,并观看了一些视频。让我们尝试一些更多的问题吧!
SQL — 问题
一般来说,面试中至少会有一个以 SQL 为重点的部分。此外,面试官可能会带你了解整个产品开发过程,选择需要跟踪的指标,然后进行查询以衡量该指标的有效性。
SQL — 视频
后续 SQL 问题
技术面试可能会很艰难。不论是针对软件工程师、数据工程师还是数据科学家。我们希望这份学习指南能帮助你跟踪进展!
如果你认为我们遗漏了什么,或者有其他你认为有帮助的资源,请告知我。谢谢!
原文。经许可转载。
简介:Ben Rogojan是位于西雅图的数据科学家兼工程师,拥有丰富的经验,设计了 ETL 管道、数据库、网站以及其他初创公司和成熟公司的软件产品。Ben 目前在一家健康分析公司担任数据工程师。
相关: