原文:
www.kdnuggets.com/5-free-university-courses-to-learn-coding-for-data-science
图片作者
我花了大约 30,000 美元攻读了一个为期 3 年的计算机科学学位,以成为数据科学家。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你组织的 IT 需求
这曾是一个昂贵且耗时的过程。
毕业后,我意识到其实可以在线学习所有必要的技能。顶级大学如哈佛、斯坦福和麻省理工学院已经发布了许多课程供任何人学习。
最棒的部分是什么?
这些课程完全免费。
由于互联网的存在,你现在可以在家中免费获得常春藤联盟的教育。
如果我可以重新开始,这里有 5 个我会选择的免费大学课程,用于学习数据科学编程。
注意:Python 和 R 是数据科学中使用最广泛的编程语言,因此该列表中的大多数课程都集中于其中一个或这两种语言。
哈佛的 CS50课程是大学提供的最受欢迎的入门级编程课程之一。
该课程带你了解计算机科学的基础,包括理论概念和实际应用。你将接触到多种编程语言,如 Python、C 和 SQL。
将此课程视为一个迷你计算机科学学位,打包成 24 小时的 YouTube 内容。相比之下,CS50 涵盖了我在大学学习了三个学期的内容。
在 CS50 中,你将学到:
-
编程基础
-
数据结构与算法
-
使用 HTML 和 CSS 进行网页设计
-
软件工程概念
-
内存管理
-
数据库管理
如果你想成为数据科学家,必须具备坚实的编程和计算机科学基础。你将经常被期望从数据库中提取数据,部署生产中的机器学习模型,并构建可扩展的模型管道。
像 CS50 这样的课程为你提供了前往学习旅程下一阶段所需的技术基础。
课程链接: 哈佛 CS50
MITx 的计算机科学与编程导论 是另一门旨在为你提供计算机科学和编程基础技能的入门课程。
然而,与 CS50 不同的是,这门课程主要用 Python 进行教学,并且着重于计算思维和问题解决。
此外,麻省理工学院的计算机科学入门课程更加侧重于数据科学及 Python 的实际应用,因此对于那些只想学习数据科学编程的学生来说,是一个很好的选择。
完成麻省理工学院的计算机科学入门课程后,你将对以下概念有一定了解:
-
Python 编程:语法、数据类型、函数
-
计算思维:问题解决、算法设计
-
数据结构:列表、元组、字典、集合
-
算法复杂度:大 O 符号
-
面向对象编程:类、对象、继承、多态
-
软件工程原则:调试、软件测试、异常处理
-
计算机科学中的数学:统计与概率、线性回归、数据建模
-
计算模型:仿真原理与技术
-
数据科学基础:数据可视化与分析
你可以在 edX 上免费旁听这门课程。
课程链接: MITx——计算机科学导论
完成了像 CS50 这样的基础计算机科学课程后,你可以选择 MIT 的算法导论 学习路径。
该项目将教你算法和数据结构的设计、分析和实现。
作为数据科学家,你常常需要实现能够在数据集规模增大时保持性能的解决方案。你还需要处理可能计算成本较高的大型数据集。
这门课程将教你优化数据处理任务,并根据可用的计算资源做出明智的决策,选择合适的算法。
你将在《算法导论》中学到以下内容:
-
算法分析
-
数据结构
-
排序算法
-
图算法
-
算法技术
-
哈希
-
计算复杂度
你可以在 MIT OpenCourseWare 上找到《算法导论》的所有讲座视频。
课程链接: MIT——算法导论
人人学 Python 是一个入门级编程专业课程,专注于教授 Python。
这是一个包含 5 门课程的学习路径,涵盖了 Python 基础、数据结构、API 使用和使用 Python 访问数据库。
与之前列出的课程不同,人人学 Python 主要是实践性的。这个专业化课程专注于实际应用,而不是理论概念。
这使得它非常适合那些想要立即投入实际项目实施的人。
在完成这个 5 门课程的专业化之后,你将熟悉以下一些概念:
-
Python 变量
-
函数和循环
-
数据结构
-
API 和访问网络数据
-
使用 Python 操作数据库
-
使用 Python 进行数据可视化
你可以在 Coursera 上免费旁听这门课程。
课程链接: 人人学 Python
你可能注意到到目前为止,每门课程都专注于 Python 编程。
那是因为我有点儿 Python 爱好者的情结。
我发现这种语言多功能且用户友好,并且 Python 的知识可以转移到数据科学以外的广泛领域。
然而,学习 R 在数据科学中也有一些好处。R 编程是专门为统计分析设计的,而且 R 中有许多专门用于参数调整和优化的包,而这些在 Python 中是没有的。
如果你对深入的统计分析、学术研究和高级数据可视化感兴趣,你应该考虑学习 R。如果你想学习 R,约翰霍普金斯大学的 R 编程专业化是一个很好的起点。
在这个专业化课程中,你将学到以下内容:
-
数据类型和函数
-
控制流
-
在 R 中阅读、清理和处理数据
-
探索性数据分析
-
数据模拟和分析
你可以在 Coursera 上免费旁听这门课程。
课程链接: R 编程专业化
一旦你完成了本文中列出的一个或多个课程,你将拥有大量新的编程知识。
但旅程并不会就此结束。
如果你的最终目标是建立一个数据科学职业生涯,这里有一些你应该考虑的潜在下一步:
我建议访问像HackerRank和Leetcode这样的编程挑战网站来练习你的编程技能。
由于编程是一种通过逐步挑战来发展技能的过程,我建议从这些平台上标记为“简单”的问题开始,例如加法或乘法两个数字。
随着你的编程技能提升,你可以开始增加难度并解决更复杂的问题。
当我刚开始进入数据科学领域时,我每天做 HackerRank 问题,大约两个月后发现我的编程技能有了显著提高。
一旦你花了几个月时间解决 HackerRank 挑战,你会发现自己已经准备好处理端到端的项目了。
你可以从创建一个简单的 Python 计算器应用开始,然后逐步进阶到更具挑战性的项目,比如数据可视化仪表板。
如果你还不知道从哪里开始,查看这个Python 项目创意列表以获得灵感。
在你学会编码并完成一些个人项目后,你可以将你的作品展示在一个集中式的作品集网站上。
当潜在雇主寻找程序员或数据科学家时,他们可以在一个地方查看你的所有工作(技能、认证和项目)。
如果你想自己构建一个作品集网站,我已经创建了一个完整的视频教程,讲解如何用 ChatGPT 免费构建数据科学作品集网站。
你可以查看教程,以获取创建视觉上吸引人的作品集网站的逐步指南。
 
 
**Natassha Selvaraj**是一位自学的数据科学家,热衷于写作。Natassha 写关于所有数据科学相关的内容,是所有数据话题的真正大师。你可以在LinkedIn上与她联系,或查看她的YouTube 频道。