Skip to content

Latest commit

 

History

History
181 lines (91 loc) · 9.5 KB

ultralearn-data-science-part1.md

File metadata and controls

181 lines (91 loc) · 9.5 KB

如何“极限学习”数据科学,第一部分

原文:www.kdnuggets.com/2019/12/ultralearn-data-science-part1.html

评论

Benthecoder撰写,开发者、作家、机器学习与 AI 爱好者

埃隆·马斯克、比尔·盖茨、沃伦·巴菲特和马克·库班。这些极度成功的人有什么共同点?


我们的前三大课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业之路。

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持你的组织 IT 需求


他们都是极限学习者。

埃隆·马斯克是一个贪婪的学习者,他利用语义树记住他读过的所有内容,并且能够从他人那里吸收信息。

尽管他取得的成功和突破可能看似不可能,我们也可以将他的框架应用到个人生活中,实现梦想。

“一句建议:重要的是将知识视为一种语义树——确保你理解基本原理,即树干和大枝条,然后再进入细节/叶子,否则就没有东西可以支撑它们。” — 埃隆·马斯克

比尔·盖茨和沃伦·巴菲特都极其好奇,并且有着难以满足的学习欲望。

沃伦·巴菲特将 80%的时间投入到阅读和思考中。比尔·盖茨每周读一本书,还会有两周的假期专门用来阅读。

“智力资本永远优于金融资本。” — 保罗·都铎·琼斯,自主创业的亿万富翁、投资者和慈善家。

什么是极限学习?

极限学习是一种强有力的、自我驱动的学习方法,使人们能够迅速有效地掌握困难技能。

通过结构化的学习方法,他们成为极限学习者,实现了最初看似不可能的非凡成就,但事实上,任何人都可以采用这种极限学习策略,实现看似不切实际的想法和梦想。

极限学习的原则

元学习

元学习——学习如何学习的过程。

元学习是学习中的一个重要概念。它是每个人在启动学习过程之前必须采取的第一步。

学习比听起来更难,因为很多人认为学习只是随机吸收信息,然后在考试中吐出来。

但实际上,学习是艰难的。我这么说是因为学校和学院已经变成了商业,学习的行为已经成为了一门失传的艺术。学生们只是为了通过考试而学习,而不再是为了学习而学习。问一个学生“为什么”而不是“什么”,他们很可能会感到困难。

关于数据科学,观看几个小时的 YouTube 视频、阅读数十本编程书籍和注册昂贵的在线课程单独是不够的。需要一个结构化的框架。

需要对基础知识有深入理解。还有对该领域的大局观理解。

大局观理解

元学习的核心是从全局视角出发,然后利用这一点制定你最优的学习策略。

大局观思维本质上意味着完整的、宏观的故事或理念。这个短语通常意味着一个人应该考虑未来,或考虑其他平行因素,而不是强调细节。

为了掌握大局观的概念,让我们将这一概念应用于数据科学。数据科学是 21 世纪最性感的工作。但大多数数据科学家在没有清晰了解数据科学的真正含义之前就跳入了这个领域。

简而言之,数据科学是揭示数据隐藏价值的过程。

数据正在指数级增长,数据科学家在利用所有这些数据方面至关重要。从基于直觉的决策,我们正在过渡到基于事实的决策。

数据科学家的艰巨任务是帮助组织根据从数据中获取的洞察做出正确的决策。

因此,使用正确的技能和数据集,数据科学家创造了一个数据驱动的世界。

元学习数据科学的策略

照片由 Tabea Damm 提供,来源于 Unsplash

(1) 创建元学习地图

将你的主题分解为三个类别:

  • 概念

  • 事实

  • 程序

概念

数据科学中的概念包括培训和教育,这些是数据科学的先决条件。

这些包括扎实的数学基础(统计学、概率论、线性代数和微积分)、编程、机器学习和人工智能,以及商业分析。

事实

数据科学中的事实将是涉及数据科学的教科书内容,例如你必须深入理解的数学和机器学习中的事实,以至于你可以将其教给其他人。

涉及的事实不应像正规教育所灌输的那样被记住,而应在原子层面上被理解,在那里你可以将术语转化为大众易于理解的语言。

程序

涉及的程序是数据科学的基础——业务理解、数据获取和准备(挖掘和清理)、部署、建模和可视化。

这些基础知识也有子领域,每个子领域在发现数据价值的过程中都至关重要。

(2) 确定学习中的挑战

数据科学并不是一个简单的领域。必须具备商业头脑和出色的沟通能力,才能将数据转化为人们可以理解和领会的内容。成为数据科学家几乎就像是世界上混乱数据的翻译者。

学习中的一些挑战包括数学,特别是对数据科学起重要作用的统计学,机器学习概念(通常需要硕士和博士学位)以及出色的沟通能力。

这一部分含糊且随意,因为每个人在不同方面都有不同的困难。所以,上述只是我的意见,并不适用于其他所有人。

(3) 克服这些挑战的技巧

费曼技巧 在学习像数据科学这样广泛且复杂的内容时非常有效。用这种技巧,机器学习概念和数学事实可以轻松存储在你的大脑中。

在沟通方面,没有一种简单的方法可以突然变得更好并成为世界级的沟通者。有些人天生具备用言辞说服他人的能力,而有些人则是通过生活中的学习获得这些能力。

沟通,就像知识一样,是我们在生活的起伏中积累的技能。关于沟通的一个建议是使用简单的词汇而非术语,以便所有人都能理解你数据的结果。

同时,根据受众个性化你的展示,因为数据工程师对数据科学的理解优于经理或利益相关者。

你可以用来沟通数据的框架

  1. 对业务问题的理解。

  2. 如何衡量业务影响——你的模型结果与哪些业务指标对齐?

  3. 数据是什么或曾经是什么——如有必要,参考哪些数据可能有助于收集。

  4. 初步解决方案假设。

  5. 解决方案/模型——使用示例和可视化。

  6. 解决方案的业务影响和对利益相关者的明确行动项。

(4) 建立你的学习方法论

有了互联网,学习数据科学不再昂贵和有限。大量的资源使得各种人群都能平等地接触数据科学。

类似于学习时面临的问题,这部分也依赖于个人。有些人可能更喜欢通过 YouTube 视频学习,而有些人则喜欢使用 Udemy 和 Coursera 等在线课程。

尽管如此,拥有学习方法是必要的,以便根据你的偏好和能力个性化你的学习方式。

学习数据科学的一个好建议是从实际项目开始,例如线性回归、逻辑回归、决策树等。

这是因为许多人犯了一个错误,即过于专注于数学,摄取大量的事实,却未能从一开始就获得实用的技能。

行动计划

现在你对超学习、元学习和大局观有了初步了解。花 5-10 分钟思考一下你是否一直以这些概念为指导进行学习。如果没有,现在是改变的最佳时机。根据以下 4 个步骤制定你的元学习策略,今天就开始正确的学习方法吧!

原文。经许可转载。

相关:

更多相关话题