Skip to content

Latest commit

 

History

History
75 lines (38 loc) · 4.03 KB

most-important-step-machine-learning-project.md

File metadata and controls

75 lines (38 loc) · 4.03 KB

机器学习项目中最重要的步骤是什么?

原文:www.kdnuggets.com/2017/08/most-important-step-machine-learning-project.html

c评论

作者:Shahar Cohen,YellowRoad

CRISP-DM 是机器学习项目的常见标准。业务理解、数据理解、数据准备、建模、评估和部署。这六个步骤对机器学习项目至关重要。每个步骤中的质量问题都会直接影响整个结果的质量。它们都很重要。

然而,在向许多组织提供机器学习建议,并自己运行更多此类项目后,我们(在 YellowRoad)得出结论,流程中投资最少的步骤是业务理解。我们看到许多公司在理解他们要解决的任务的业务方面之前,讨论算法和技术。这显然不是一个好的起点。

我们编制了一系列问题,用于任何我们参与的机器学习项目,在得到这些问题的良好答案之前,我们不会在后续步骤上投入过多精力。我们发现这种做法非常有帮助。

这些是问题:

  1. 我们试图实现什么目标,从业务角度来看?这有多重要?

  2. 我们正在尝试解决的任务的输入和输出是什么?

  3. 给定一个假设的解决方案,它将如何影响我们的操作?(另一种问法是:假设我有一个完美的解决方案,你将如何使用它?)

  4. 我们是否已经具备根据这种解决方案行动的能力,还是我们还需要开发这种能力?(如果能力已经具备,仔细学习。如果没有,保持与负责开发该能力的团队的紧密联系)

  5. 我们将如何衡量建议的解决方案?(关键绩效指标)

  6. 什么会使它成功?

  7. 我们是否有可用的输入数据?提取这些数据有多难?我们是否被允许使用这些数据?

  8. 我们是否有构建类似解决方案的经验?我们是否了解需要什么?

  9. 我们是否面临严格的预算和时间限制?

  10. 谁将开发解决方案?我们是否具备所需的内部技能?

原文。经许可转载。

简历: Shahar Cohen 是 YellowRoad 的联合创始人,同时也是一位经验丰富的数据科学家和研究员,拥有超过 10 年的经验。

相关:

  • 数据科学家如何提高生产力

  • 数据版本控制:迭代机器学习

  • 解决 CRISP-DM 中的部署和迭代问题


我们的三大课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业生涯

2. Google 数据分析专业证书 - 提升你的数据分析能力

3. Google IT 支持专业证书 - 支持你的组织的 IT


更多相关主题