原文:
www.kdnuggets.com/2022/03/8-free-mit-courses-learn-data-science-online.html
图片由 Fotis Fotopoulos 提供,Unsplash
我报名参加了一个本科计算机科学项目,并决定主修数据科学。在三年期间我花费了超过$25K 的学费,结果毕业后发现自己没有获得足够的技能来找到相关领域的工作。
1. 谷歌网络安全证书 - 快速进入网络安全职业道路
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你在 IT 领域的组织
我几乎不知道如何编码,对最基本的机器学习概念也不清楚。
我花了一些时间尝试自己学习数据科学——借助 YouTube 视频、在线课程和教程。我意识到所有这些知识都可以在互联网上公开获取,并且是免费的。
令我惊讶的是,即使是常春藤盟校也开始让许多课程向全球学生开放,几乎没有费用。这意味着像我这样的人可以从一些世界上最好的机构学习这些技能,而不是花费数千美元去读一个质量一般的学位课程。
在本文中,我将为你提供一个我使用仅有的免费 MIT 在线课程创建的数据科学路线图。
我强烈建议在深入了解数据科学模型的数学和理论之前学习一门编程语言。一旦你学会编程,你将能够处理真实世界的数据集,并感受预测算法的运作方式。
MIT 开放课程提供了一个面向初学者的 Python 程序,叫做计算机科学与编程导论。
这个课程旨在帮助没有编码经验的人编写程序,以解决有用的问题。
统计学是每个数据科学工作流程的核心——无论是在构建预测模型、分析大量数据中的趋势,还是选择用于模型的数据特征时,它都是必需的。
MIT 开放课程还提供了一门初学者友好的课程,概率与统计导论。完成此课程后,你将了解统计推断和概率的基本原理。涉及的一些概念包括条件概率、贝叶斯定理、协方差、中心极限定理、重抽样和线性回归。
这门课程还将指导你使用 R 编程语言进行统计分析,这对你作为数据科学家的工具栈有很大帮助。
MIT 还提供了另一个免费的实用课程,统计思维与数据分析。这是该主题的另一门基础课程,将带你了解 Excel、R 和 Matlab 中的各种数据分析技术。
你将学习数据收集、分析、不同类型的抽样分布、统计推断、线性回归、多元线性回归和非参数统计方法。
微积分和线性代数是机器学习领域中使用的另外两个数学分支。修习这些学科的一两门课程将使你对预测模型的运作和基础算法有不同的认识。
要学习微积分,你可以先参加 MIT 提供的免费单变量微积分,然后再学习多变量微积分。
然后,你可以参加由 Gilbert Strang 教授讲授的线性代数课程,以深入掌握该学科。
上述所有课程均由 MIT 开放课程提供,并配有讲义、习题集、考试题目和解决方案。
最后,你可以利用以上课程所学的知识参加 MIT 的机器学习导论课程。该项目将指导你如何在 Python 中实现预测模型。
该课程的核心重点是监督学习和强化学习问题,你将学习到如泛化和如何减轻过拟合等概念。除了处理结构化数据集,你还将学习如何处理图像和序列数据。
MIT 的机器学习项目列出了三个前置条件——Python、线性代数和微积分,因此建议在开始此课程之前完成上述课程。
即使你没有编程、统计或数学的基础知识,你也可以参加上述列出的所有课程。
MIT 设计了这些程序,以从零开始带你学习该主题。然而,与许多其他 MOOC 课程不同,进度会相对较快,并且课程内容覆盖了较大的深度。
因此,建议完成所有讲座附带的练习,并学习提供的所有阅读材料。
Natassha Selvaraj 是一位自学成才的数据科学家,热衷于写作。你可以在 LinkedIn 上与她联系。