Skip to content

Latest commit

 

History

History
119 lines (60 loc) · 8.09 KB

domingos-5-tribes-machine-learning-questions-answers.md

File metadata and controls

119 lines (60 loc) · 8.09 KB

机器学习的 5 个部落 – 问题与答案

原文:www.kdnuggets.com/2015/11/domingos-5-tribes-machine-learning-questions-answers.html

c 评论

11 月 24 日,我主持了Pedro Domingos 200 ACM 网络研讨会与 Pedro Domingos

Pedro,机器学习和数据科学的领先研究者之一,详细讲解了他的优秀书籍,《主算法》,其中解释了机器学习的 5 个部落的方法:符号主义者、连接主义者、进化主义者、贝叶斯主义者和类比主义者,以及如何结合这些方法以寻找能够彻底改变我们世界的主算法。

5 部落机器学习

超过 1500 人参加了此次网络研讨会。

介绍 Pedro 后,我准备放松并享受演讲,但我的主持人角色却意外地变得非常紧张,因为仅仅几分钟后,许多问题开始涌入,我必须迅速阅读和优先处理这些问题。

Pedro 只有时间回答了 100 多个提交中的 5 个问题,但许多问题都非常好,因此我要求他回答一些其他有趣的问题。

另见 Pedro 对我早期问题的回答:

主算法深度学习是主算法吗?

(帖子底部)

这里是 Pedro Domingos 对网络研讨会中他没有时间现场回答的额外问题的回答。

Juan Alvarado 提问:为了获得主算法,您是否考虑过由于哥德尔不完备定理而使其不可能?

Pedro Domingos: 主算法仅学习可学习的内容;它无法证明哥德尔定理无法证明的命题。

Pramod Anantharam:你认为可解释的模型是否会在未来战胜基于黑箱的方法?

PD: 这取决于应用程序。可解释性是一个非常重要的属性,对于许多应用程序,它优先于从(比如)深度学习中获得的额外准确性。

Mohamed Helmy:我们能简要了解一下规则引擎和符号逻辑(决策树)吗?

PD: 当然,可以查看《主算法》第三章或我的MOOC(Coursera 上的机器学习)的第二和第三周。

Jesus Morales:对于想要追随这条路径的大学生,他们在开始之前需要了解哪些建议?

PD: 上 MOOC 课程,阅读教科书,尝试一些算法。请参见《大师算法》中的进一步阅读部分。

Cristal Jones-Harris, 你有 360 度推荐系统的文本样本吗?

PD: 参见我在《华尔街日报》上发表的文章《"为你的数字模型做好准备"》。

Subhra Mazumdar: 360 度推荐系统会影响人的决策能力吗?它会成为人和机器的共生关系,还是更倾向于主奴关系?

PD: 360 度推荐系统是你大脑的扩展,因此你掌控一切。它所做的只是尽力做出你在有时间时会做出的选择,并且当它出错时,它应该学会在下次做得更好。

Abdelaziz Mahoui, 在新的 360 度推荐系统中,偶然性将如何表现?

PD: 推荐系统应该具有随机组件,就像现实生活一样。

Delane Pickel: “主算法”这个问题意味着只有一个。终极学习机器必须具备某种成功学习的理解能力。一些学习实际上可能变得具有破坏性。这不正是癌症吗?

PD: 大师算法有多于一种版本,就像有许多等同于图灵机的计算方案一样。它所学到的内容取决于你给它的数据和评估函数。

Aude Dufresne: 如果评估和优化改变现实怎么办?

PD: 不确定你指的是什么,但学习结果的部署往往会导致被建模的人改变他们的行为。这是一个重要且尚未充分探索的问题,但可以参考我在 KDD-04 会议上发表的论文《"对抗分类"》。

Michael Valenzuela: Wolpert 的《无免费午餐定理》证明了不存在“通用”机器学习算法。你如何调和这个证明和你的目标?

PD: 大师算法只需在我们的世界中有效,而非所有可能的世界,“无免费午餐”定理涉及的是后者。此外,大师算法不仅以数据为输入;它还输入知识(例如,逻辑公式)。

Jim Talley: 首先,那是一个非常好的总结。不过,在我看来,仍然缺少的部分是感知,或者更具体地说,是学习如何构建和准备这些五种范式的输入。对此有什么想法?你认为这已经是这些范式之一或多种的组成部分吗?

PD: 每种范式都有其解决这个问题的方法,确实需要解决。例如,深度学习的主要主张是它从原始数据(例如,像素)中学习自身的表示。

Joanna Biega: 那么关于存储大量数据的传统数据结构呢?我们是否忘记了不仅需要良好的机器学习算法或渐进线性算法,还需要有效的大数据数据结构?

PD: 确实,一个通用的学习者必须高效,数据结构是其中的重要部分。

Bhaskar Veeraraghavan, 主动强化学习有什么应用吗?

PD: 强化学习在某种意义上是主动学习。我听说 Deep Mind 正在将其应用于网页搜索,这将是一个主要应用,如果部署在 Google 的引擎中。

Habibollah Daneshpajouh, 正如你提到的,每个领域的这些“部落”在某些问题上表现更好,我们如何检测出在特定问题上最适合的 ML“部落”?

PD: 尽管进行了大量研究,但没有人能给出一个好的理论答案,不过有很多实用的启发式方法,你也可以尝试所有的方法。

Latha Krishnaswamy, ML 算法通常是无监督的。在你看来,这种情况允许或受限于缺乏人工监督的影响是什么?

PD: 实际上,监督学习的使用频率高于无监督学习。如果有监督(或获取成本不高),肯定要使用监督。

Parlinggoman Hasibuan, 你认为机器学习能做决策并取代人类吗?

PD: 是的,在许多领域已经如此(例如,信用评分、直销)。

Raul Sierra: 你谈到主算法,但我们是否也需要类似主任务的东西来评估主算法?

PD: 当然了。我们需要一组足够多样且困难的任务,如果学习算法能解决这些任务,我们就可以合理地称之为主算法。

Theodore Grammatikopoulos: 从一个主算法构建一个可能为不同的数据片段(列、行)选择不同算法并赋予适当权重的角度来看,这会是个好主意吗?

PD: 这实际上是一种模型集成,正如我讨论的那样,它比单一模型更好,但还不是主算法。

Wee Kiat: 你认为主算法是否能解决当前无法解决的问题?如果可以,机器学习会比我们的大脑更优越吗?

PD: 是的,确实如此,比如治愈癌症。但问题不在于机器学习是否会优于我们的脑,而在于我们的脑结合机器学习是否会优于没有机器学习的脑。

Victor: 你认为下一个接近突破的机器学习进展是什么?

PD: 我不知道,但我正在研究一些候选者 :)

更多相关话题