机器学习的 5 个部落 – 问题与答案

原文：www.kdnuggets.com/2015/11/domingos-5-tribes-machine-learning-questions-answers.html

11 月 24 日，我主持了。

Pedro，机器学习和数据科学的领先研究者之一，详细讲解了他的优秀书籍，《主算法》，其中解释了机器学习的 5 个部落的方法：符号主义者、连接主义者、进化主义者、贝叶斯主义者和类比主义者，以及如何结合这些方法以寻找能够彻底改变我们世界的主算法。

超过 1500 人参加了此次网络研讨会。

介绍 Pedro 后，我准备放松并享受演讲，但我的主持人角色却意外地变得非常紧张，因为仅仅几分钟后，许多问题开始涌入，我必须迅速阅读和优先处理这些问题。

Pedro 只有时间回答了 100 多个提交中的 5 个问题，但许多问题都非常好，因此我要求他回答一些其他有趣的问题。

另见 Pedro 对我早期问题的回答：

（帖子底部）

这里是 Pedro Domingos 对网络研讨会中他没有时间现场回答的额外问题的回答。

Juan Alvarado 提问：为了获得主算法，您是否考虑过由于哥德尔不完备定理而使其不可能？

Pedro Domingos: 主算法仅学习可学习的内容；它无法证明哥德尔定理无法证明的命题。

Pramod Anantharam：你认为可解释的模型是否会在未来战胜基于黑箱的方法？

PD: 这取决于应用程序。可解释性是一个非常重要的属性，对于许多应用程序，它优先于从（比如）深度学习中获得的额外准确性。

Mohamed Helmy：我们能简要了解一下规则引擎和符号逻辑（决策树）吗？

PD: 当然，可以查看《主算法》第三章或我的MOOC（Coursera 上的机器学习）的第二和第三周。

Jesus Morales：对于想要追随这条路径的大学生，他们在开始之前需要了解哪些建议？

PD: 上 MOOC 课程，阅读教科书，尝试一些算法。请参见《大师算法》中的进一步阅读部分。

Cristal Jones-Harris, 你有 360 度推荐系统的文本样本吗？

PD: 参见我在《华尔街日报》上发表的文章《"为你的数字模型做好准备"》。

Subhra Mazumdar: 360 度推荐系统会影响人的决策能力吗？它会成为人和机器的共生关系，还是更倾向于主奴关系？

PD: 360 度推荐系统是你大脑的扩展，因此你掌控一切。它所做的只是尽力做出你在有时间时会做出的选择，并且当它出错时，它应该学会在下次做得更好。

Abdelaziz Mahoui, 在新的 360 度推荐系统中，偶然性将如何表现？

PD: 推荐系统应该具有随机组件，就像现实生活一样。

Delane Pickel: “主算法”这个问题意味着只有一个。终极学习机器必须具备某种成功学习的理解能力。一些学习实际上可能变得具有破坏性。这不正是癌症吗？

PD: 大师算法有多于一种版本，就像有许多等同于图灵机的计算方案一样。它所学到的内容取决于你给它的数据和评估函数。

Aude Dufresne: 如果评估和优化改变现实怎么办？

PD: 不确定你指的是什么，但学习结果的部署往往会导致被建模的人改变他们的行为。这是一个重要且尚未充分探索的问题，但可以参考我在 KDD-04 会议上发表的论文《"对抗分类"》。

Michael Valenzuela: Wolpert 的《无免费午餐定理》证明了不存在“通用”机器学习算法。你如何调和这个证明和你的目标？

PD: 大师算法只需在我们的世界中有效，而非所有可能的世界，“无免费午餐”定理涉及的是后者。此外，大师算法不仅以数据为输入；它还输入知识（例如，逻辑公式）。

Jim Talley: 首先，那是一个非常好的总结。不过，在我看来，仍然缺少的部分是感知，或者更具体地说，是学习如何构建和准备这些五种范式的输入。对此有什么想法？你认为这已经是这些范式之一或多种的组成部分吗？

PD: 每种范式都有其解决这个问题的方法，确实需要解决。例如，深度学习的主要主张是它从原始数据（例如，像素）中学习自身的表示。

Joanna Biega: 那么关于存储大量数据的传统数据结构呢？我们是否忘记了不仅需要良好的机器学习算法或渐进线性算法，还需要有效的大数据数据结构？

PD: 确实，一个通用的学习者必须高效，数据结构是其中的重要部分。

Bhaskar Veeraraghavan, 主动强化学习有什么应用吗？

PD: 强化学习在某种意义上是主动学习。我听说 Deep Mind 正在将其应用于网页搜索，这将是一个主要应用，如果部署在 Google 的引擎中。

Habibollah Daneshpajouh, 正如你提到的，每个领域的这些“部落”在某些问题上表现更好，我们如何检测出在特定问题上最适合的 ML“部落”？

PD: 尽管进行了大量研究，但没有人能给出一个好的理论答案，不过有很多实用的启发式方法，你也可以尝试所有的方法。

Latha Krishnaswamy, ML 算法通常是无监督的。在你看来，这种情况允许或受限于缺乏人工监督的影响是什么？

PD: 实际上，监督学习的使用频率高于无监督学习。如果有监督（或获取成本不高），肯定要使用监督。

Parlinggoman Hasibuan, 你认为机器学习能做决策并取代人类吗？

PD: 是的，在许多领域已经如此（例如，信用评分、直销）。

Raul Sierra: 你谈到主算法，但我们是否也需要类似主任务的东西来评估主算法？

PD: 当然了。我们需要一组足够多样且困难的任务，如果学习算法能解决这些任务，我们就可以合理地称之为主算法。

Theodore Grammatikopoulos: 从一个主算法构建一个可能为不同的数据片段（列、行）选择不同算法并赋予适当权重的角度来看，这会是个好主意吗？

PD: 这实际上是一种模型集成，正如我讨论的那样，它比单一模型更好，但还不是主算法。

Wee Kiat: 你认为主算法是否能解决当前无法解决的问题？如果可以，机器学习会比我们的大脑更优越吗？

PD: 是的，确实如此，比如治愈癌症。但问题不在于机器学习是否会优于我们的脑，而在于我们的脑结合机器学习是否会优于没有机器学习的脑。

Victor: 你认为下一个接近突破的机器学习进展是什么？

PD: 我不知道，但我正在研究一些候选者 :)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

domingos-5-tribes-machine-learning-questions-answers.md

domingos-5-tribes-machine-learning-questions-answers.md

机器学习的 5 个部落 – 问题与答案

更多相关话题

Files

domingos-5-tribes-machine-learning-questions-answers.md

Latest commit

History

domingos-5-tribes-machine-learning-questions-answers.md

File metadata and controls

机器学习的 5 个部落 – 问题与答案

更多相关话题