Skip to content

Latest commit

 

History

History
115 lines (58 loc) · 6.65 KB

7-types-data-scientist-job-profiles.md

File metadata and controls

115 lines (58 loc) · 6.65 KB

数据科学家职业的 7 种类型

原文:www.kdnuggets.com/2017/03/7-types-data-scientist-job-profiles.html

c 评论

作者:Muktabh Mayank,ParallelDots

所以,是的,这篇文章可能看起来像个点击诱饵,但我保证它并不是完全那样(嗯,稍微有点)。


我们的三大课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全领域的职业生涯。

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持组织的 IT 需求


最近我在 Quora 上收到一个问题,询问公司在招聘数据科学家时具体需要哪些技能?数据科学家角色是否有定义?很明显,没有一个统一的角色,因为每家公司都在解决自己的一套问题。但我尝试制定了一些通用的职业角色,这些角色可以在一定程度上适应不同公司的职位描述。我认为种类太多了,但我不得不缩小到一组角色,所以这里是列表:

  1. R 使用数据分析工具。 能快速在 R/Python 中进行分组和计数。这种角色是早期数据分析师的编码版本。在更倾向于分析的组织中,自动报告生成是这种角色最常见的场所。

    使用工具:R(数据框),SQL

    R_logo.svg

    831px-SQL_ANATOMY_wiki.svg

  2. 建模者。 深入的数学思维,能够应用贝叶斯/频率学推断或层次模型。也许我在这里将太多人归为一组,当分析药物试验的人员、建模复杂现象的科学家和对股票进行自回归模型分析的人被归为一组时。这儿的共同主题是,数学是工作的基础。

    使用工具:R 非常受欢迎,Fortran,C++和有时的函数语言。

    Mathematical_models_for_complex_systems

    Eigen_Silly_Professor_135x135

  3. 偶尔从事数据科学工作的数据工程师。从这里取一个库,从那里取一些代码,制作出足够好的东西,同时管理数据管道。这是一种非常常见的角色,数据科学任务包括编写程序自动生成 Pandas 报告、尝试简单的机器学习模型,以及(如今)在数据上运行预训练的神经网络。

    工具:Python 工具链、Pandas、nltk、Keras。

    Python_logo_and_wordmark.svg

    220px-Hadoop_logo.svg

    pandas

  4. 表格机器学习者(或 XGBoost 专家)。热衷于 Kaggle,能够训练多个算法并堆叠模型,极大地优化它们。这些人对运行和优化标准算法,如 XGBoost、Ridge Regression 和(现在)Keras 模型,有深厚的专业知识。

    工具:Python 或 R,常用 XGB 和 Keras。

    xgboost

    Keras_Logo

  5. 老派的机器学习者。接近于 4,但不限于分类模型。非常擅长特征工程。这是唯一的机器学习专长,直到较新的深度学习概念出现。

    工具:C++ / Python 及 Scikit Learn。

    Scikit-learn_logo

    dlib-logo

    mlpack

  6. 深度学习专家。需要一个 GPU 系统和一个标记良好的数据集,并尝试各种架构,不需要进行特征工程。将花费大量时间尝试架构,特征工程时间较少,但准确性会非常高。

    工具:Python、Theano、Tensorflow 以及像 Keras 这样的高级库。

    theano

    TensorFlowLogo

  7. 领域专家。对领域有深入了解,了解一些线性模型。将领域信息编码,并在其上训练线性算法。包括机械工程师、各公司分析师和纯/应用科学的科学家。

    工具:不同的专业使用不同的工具。工程师使用 Matlab,C++/Fortran,有时使用 R/Python。

    r-bioconductor-training

    800px-NumericalRecipes3rdEdCover

  8. 新手。实习生。将会发展成其导师所属于的 7 种类别中的一种。

    在 ParallelDots,我们有 2、3、4、5 和 6 类型的人才。(如果你想全职加入我们,也可以是 8 类型。)

Muktabh Mayank 是一位数据科学家兼企业家,也是 ParallelDots 的联合创始人。

ParallelDots 帮助企业理解其非结构化数据,为其提供定制的深度学习解决方案。其新产品 Karna AI 使用 AI 从成千上万的新闻和社交媒体来源自动生成关于任何主题的报告。该公司还在开发几款即将推出的令人兴奋的 AI 优先产品。

原文。经授权转载。

相关:

  • 大数据和数据科学中的 5 条职业路径解析

  • 探索大数据中有趣的 12 种职业

  • 人类数据科学家:在自动化世界中保护你的职业

更多相关话题