原文:
www.kdnuggets.com/2021/10/building-operationalizing-machine-learning-models.html
评论
由 杰森·雷维尔,首席技术官,Datatron。
机器学习的最大承诺之一是通过计算人类认知来简化事物。随着企业在数字化转型过程中实施机器学习(ML)以提升收入和运营,但所有机器学习背后的承诺和机遇,可能会迅速让负责管理生产中的 ML 的团队感到困难。
各行业的组织都在使用 ML 处理各种过程:预测价格、检测欺诈、分类健康风险、处理文档、预防性维护等。模型在历史数据上进行训练和评估,直到它们似乎符合性能和准确性的目标。结果承诺通过预测、分类或建议未来结果并采取行动来创造高业务价值。企业渴望获得机器学习所承诺的好处。
然而,一旦模型“准备好”后,通过可靠的交付机制自动化其使用会引入操作复杂性和风险,需要细致关注。交付和操作团队必须全面管理 ML 生命周期,以使这些项目高效有效。数据必须可用且质量符合预期,与训练时使用的数据相比。随着认识的深入,业务开始出现其他复杂性:这与其他工程工作并不完全相同,你需要以不同的方式思考问题,才能真正成为一个 AI 驱动的公司。要在机器学习,尤其是 ML 模型方面取得成功,以下是你应该考虑的三件事:
ML 模型从来不会在第一次、第二次……或通常甚至第三次就完全正确!训练和生产之间的数据往往不匹配,难以一次性做到完美。进行具体且有针对性的投资,设置可以运行并记录结果的部署目标,确保这些结果在生产系统或客户面前不可见,并且能够在找到合适的模型之前轻松流畅地进行部署。从长远来看,假设模型会经历大量优化或调整,并需要将当前版本与承诺带来更好结果的新候选进行比较,这样做要更加有效和经济。
机器学习是一个快速增长和多样化的领域,技术供应商的名单不断扩展,无论大小。没有人会质疑 IT 需要维持适当的控制、进行安全扫描和支持操作环境。然而,将相同的控制和流程用于管理操作或产品托管技术到您的机器学习实践中,很可能会大大降低您在跨越起跑线之前所获得的回报。此外,许多数据科学家是强大的技术专家和发明家,如果他们觉得被迫在不改变所用技术或如何利用它的情况下不断提供更好的结果,他们可能会寻找其他就业机会。
创建机器学习模型是一个与软件开发截然不同的过程——试图以相同的方式处理将会让您陷入困境。许多企业目前选择将模型交付视为另一个软件发布,结果导致顺序的、延长的时间表,跨切功能如监控和分析的空白,以及创作者和操作员之间的高知识转移开销。部署和支持您的模型的专家必须理解模型和数据的工作原理,而不仅仅是处理错误代码和服务可靠性。寻找合适的人才,建立混合团队并投资于工具,以便您不仅可以测试和解释软件是否执行,还可以评估响应的准确性和可解释性。
机器学习模型有潜力为您的组织带来巨大的效率和优势,但跟上构建和管理一个可靠模型的所有方面可能成为一个全方位的企业问题。必须早早识别其操作复杂性和风险;考虑使用这些和其他原则来预见您的问题和挑战将出现在哪里。如果管理得当,机器学习模型可以非常灵活,易于改变,并且值得付出学习成本。
个人简介: 杰森·雷维尔是一位技术领导者,拥有在创建解决方案和平台方面的混合产品管理经验,并且曾在小型技术公司到大型企业中担任过工程和开发角色。
相关:
1. Google 网络安全证书 - 快速进入网络安全职业轨道。
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持组织的 IT 工作