原文:
www.kdnuggets.com/2016/10/machine-learning-complete-detailed-overview.html
机器学习因多种关键原因而成为一个非常热门的话题,它能够自动获取深入的见解、识别未知模式,并从数据中创建高性能的预测模型,而无需明确的编程指令。
这是一个包含链接的总结,指向一系列文章,旨在成为机器学习的全面、深入指南,对从商业高管到机器学习从业者的每个人都应该有用。它涵盖了机器学习(以及许多相关领域)的几乎所有方面,并且应该能作为该领域术语、概念、工具、注意事项和技术的充分介绍或参考。
系列的第一章首先给出了机器学习的正式和非正式定义。接着讨论了机器学习过程的端到端、不同类型的机器学习、潜在的目标和输出,以及最常用的机器学习算法的分类概述。
第二章以模型性能的概念介绍开始。讨论随后转向数据选择、预处理、拆分,以及非常有趣且关键的特征选择和特征工程话题。接着讨论了模型选择及其相关的权衡,这是一个关键步骤,因为不同的模型可以用来解决相同的问题,尽管有些模型表现更好。
第三章介绍了模型方差、偏差和过拟合的关键概念。接着讨论了模型复杂性及其控制方法,这对过拟合或缺乏过拟合有很大的影响。随后,你会看到对降维的简要介绍,最后讨论了模型评估、性能、调优、验证、集成学习和重采样方法。
第四章着重于对模型性能和错误分析的深入探讨。能够确定你使用的模型的性能和错误至关重要,因为这有助于判断你是否找到了具有可接受权衡的可行解决方案,或者是否需要进行一些更改。可能的更改包括选择不同的特征和/或模型、收集更多数据、特征工程、复杂性降低、利用集成方法等等。
第五章是系列的最后一章,深入概述了无监督学习。它接着讨论了与机器学习高度相关的其他领域,如预测分析、人工智能、统计学习和数据挖掘。文章最后简要概述了机器学习在实际应用中的使用情况。
阅读完系列中的五篇文章后,你将全面了解机器学习的大部分关键概念和方面。此外,你应该能够确定哪些领域最感兴趣,从而指导进一步的研究。
干杯,希望你享受你的机器学习之旅!
亚历克斯·卡斯特鲁尼斯是Why of AI的创始人兼 CEO,以及《AI for People and Business》的作者。他还是西北大学凯洛格/麦考密克 MBAi 项目的兼职讲师。
相关:
-
进入机器学习职业前要阅读的 5 本电子书
-
掌握 Python 机器学习的 7 个步骤
-
机器学习工程师需要了解的 10 种算法
1. 谷歌网络安全证书 - 快速进入网络安全职业道路。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织 IT 需求