作者插图
当你进入数据科学领域时,你会发现各种资源触手可及,比如 Udemy 课程、YouTube 视频和文章。但是,你需要给自己一个明确的学习结构,以避免感到不知所措和失去动力。
1. Google 网络安全证书 - 快速进入网络安全职业。
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你的组织的 IT 需求
本文将探讨五本涵盖数据科学旅程中应学习的基本概念的书籍。这些书籍各自帮助学习:
-
Python
-
统计
-
线性代数
-
机器学习
-
深度学习
书籍链接: Python 极速之旅
如果你有兴趣开始学习 Python 而不想花费太多时间,这本书可能非常适合你。它对 Python 的基本概念进行了非常简短的概述。除了这本 100 页的书之外,还有一个包含练习的 GitHub 代码库。
特别是,你可以快速学习 Python 的主要数据类型:整数、浮点数、字符串、布尔值、列表、元组、字典和集合。在书的最后,有一个对 Python 库的简要概述,包括 NumPy、Pandas、Matplotlib、Scipy。
它涵盖了以下内容:
-
基本语法
-
变量
-
运算符
-
主要数据类型
-
For Loop
-
While 循环
-
函数
-
If-elif-else
-
Python 库的快速概览
书籍链接: Think Stats: Probability and Statistics
在没有将所学内容付诸实践的情况下,很难获得良好的概率和统计知识。这本书的美妙之处在于它专注于一些基本概念,不仅展示理论,还有用 Python 编写的实际练习。
这本书涵盖了:
-
概要统计
-
数据分布
-
概率分布
-
贝叶斯定理
-
中心极限定理
-
假设检验
-
估计
书籍链接: 应用机器学习的线性代数入门
当你在大学学习线性代数时,大多数时候教授会讲解所有的理论而没有任何实际应用。因此,你最终参加考试,并在完成后忘记所有概念,因为在你的头脑中这些太抽象了。
幸运的是,我找到了一本出色的书,它为你介绍了线性代数的基础知识,这些知识在学习机器学习模型时会遇到。每个理论概念后面都有一个使用 NumPy 编写的实际例子,NumPy 是一个知名的科学计算 Python 库。
主要涵盖的主题包括:
-
向量
-
矩阵
-
投影
-
行列式
-
特征值和特征向量
-
奇异值分解
图书链接:Introduction to Machine Learning with Python
在学习 Python、统计学和线性代数后,是时候深入了解机器学习模型,以解决实际问题。这本书适合刚入门的人,并使用 scikit-learn 进行机器学习应用。
主要解释的机器学习模型包括:
-
线性回归
-
朴素贝叶斯
-
决策树
-
决策树集成
-
支持向量机
-
主成分分析
-
t-SNE
-
K 均值聚类
-
DBSCAN
图书链接:Deep Learning with Python
这本第五本也是最后一本书是为那些已经具备 Python 编程知识的人设计的,不需要先前的机器学习经验。这本书的作者是Francois Chollet,他是谷歌的工程师和 AI 研究员,以创建 Keras 而闻名,Keras 是 2015 年发布的深度学习库。这些是最重要的概念:
-
神经网络
-
卷积神经网络
-
循环神经网络
-
LSTM
-
生成对抗网络
这些建议对于希望进入数据科学领域的初学者都很有帮助。此外,它们对那些意识到自己在某些概念上知识不足并需要加强理解的数据科学家和研究人员也很有用。希望你喜欢这份书单。你知道其他关于数据科学的有用书籍吗?如果有值得一提的建议,请在评论中分享。
Eugenia Anello目前是意大利帕多瓦大学信息工程系的研究员。她的研究项目专注于结合异常检测的持续学习。