Skip to content

Latest commit

 

History

History
115 lines (61 loc) · 10.5 KB

15-free-data-science-machine-learning-statistics-ebooks-2021.md

File metadata and controls

115 lines (61 loc) · 10.5 KB

2021 年 15 本免费数据科学、机器学习与统计学电子书

原文:www.kdnuggets.com/2020/12/15-free-data-science-machine-learning-statistics-ebooks-2021.html

评论

在 KDnuggets,我们在过去一年中为读者带来了一些免费的电子书。在其他突显这些材料的文章中,自从疫情爆发以来,我写了一系列文章,考虑到更多人可能会在家中度过更多时间,从而增加了阅读时间。当然,过去九个月的生活显然不是大家所期待的,但是对于那些能在空闲时光抽出一点时间的人,我们希望在这段困难时期我们分享的一些电子书可能会有所帮助。

图像

图片来源


我们的前三大课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业轨道

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持你的组织的 IT 需求


当我回顾那些我在 2020 年撰写过书评的书籍时,我决定通过将 15 本书汇总到一个地方来结束这一年。如果你最初错过了其中的一些或全部书籍,这是你赶上阅读的机会。

随着这一点,我们随机再次呈现 15 本顶级免费电子书,帮助你开启 2021 年,并附上了我原始书评中的书单。

数据科学与机器学习:数学与统计方法,作者:D.P. Kroese, Z.I. Botev, T. Taimre & R. Vaisman

《数据科学与机器学习:数学与统计方法》是一本以实践为导向的教材,重点在于使用 Python 进行数据科学和实现机器学习模型。它很好地解释了相关理论,并在需要时介绍了必要的数学知识,从而使得这本实用书的节奏非常好。

R 文本挖掘:简洁方法,作者:Julia Silge 和 David Robinson

《R 的文本挖掘:一种整洁的方法》代码密集,似乎能很好地解释概念。重点在于实际应用,这与书名不谋而合,对 R 新手来说,似乎做得非常好。我没有跟着整本书的内容,但读了前两章,感觉得到了预期的内容。

因果推断:如果,作者 Miguel Hernán 和 Jamie Robins

因果推断是一个复杂而全面的主题,但这本书的作者尽力将他们认为最重要的基本方面压缩到约 300 页的文本中。由于很少有专门讲述这个主题的书籍,如果你有兴趣建立自己的概念基础,这本书可能是你的首选。

使用 Julia 进行统计:数据科学、机器学习和人工智能的基础,作者 Yoni Nazarathy 和 Hayden Klok

这本书在下一章将进入统计概念,从那时起,概念将层层递进,涉及更高级的主题,如统计推断、置信区间、假设检验、线性回归、机器学习等。

这是我一直在等待的资源,它将有效地教我如何使用 Julia 进行数据科学,就像我一直想学的那样。我希望你和我一样,对开始你的学习之旅感到兴奋。

数据科学基础,作者 Avrim Blum、John Hopcroft 和 Ravindran Kannan

在许多当代书籍中,数据科学被简化为一系列编程工具,只要掌握这些工具,就能为你完成数据科学工作。似乎对与代码无关的基本概念和理论的强调较少。这本书是这种趋势的一个反例,它无疑会为你提供从事数据科学所需的理论知识,建立坚实的基础。

理解机器学习:从理论到算法,作者 Shai Shalev-Shwartz 和 Shai Ben-David

一旦可能的数学理论冲击消退,你会发现对从偏差-方差权衡到线性回归再到模型验证策略、模型提升、核方法、预测问题等主题的全面阐述。这种全面处理的好处在于,你的理解将超越仅仅掌握抽象直觉。

使用 Python 进行自然语言处理,作者 Steven Bird、Ewan Klein 和 Edward Loper

这本书开篇较慢——描述了自然语言处理(NLP)、Python 如何用于执行一些 NLP 编程任务、如何访问自然语言内容进行处理——然后逐步转向更大的概念,无论是概念上(NLP)还是编程上(Python)。很快,它就会涉及到分类、文本分类、信息提取以及其他通常被认为是经典 NLP 的主题。在掌握了这本书的 NLP 基础知识后,你可以继续学习更现代和前沿的技术,例如通过一些斯坦福大学的免费课程。

《利用 fastai 和 PyTorch 进行深度学习:无需博士学位的 AI 应用》,作者:杰里米·霍华德和西尔万·古格

这本书的特别之处在于它是“自上而下”教学的。我们通过实际示例来讲授几乎所有内容。在构建这些示例的过程中,我们会逐步深入,并展示如何不断改进你的项目。这意味着你将逐渐在实际背景中学习所需的所有理论基础,从而看到其重要性和工作原理。我们花了多年时间构建工具和教学方法,使以前复杂的主题变得非常简单。

—杰里米·霍华德

人人都能学 Python,作者:查尔斯·R·塞弗朗斯

书籍的 448 条评价,平均评分为 4.6 分(满分 5 分),应能告诉你许多人也发现《人人都能学 Python》非常有用。共识似乎是,这本书快速覆盖了概念,以易于理解的方式进行,并直接跳入相应的代码中。

《自动化机器学习:方法、系统、挑战》,编辑:弗兰克·胡特、拉斯·科特霍夫和华金·范斯科伦

如果你对自动化机器学习在实践中的理解几乎为零,也不要担心。这本书首先提供了对该主题的扎实介绍,并明确列出了每章的期望内容,这在由独立章节组成的书中非常重要。在此之后,书的第一部分直接涉及当代 AutoML 的重要话题,并且要相信这一点,因为这本书是在 2019 年编写的。接下来的部分是对实现这些 AutoML 概念的六种工具的逐步讲解。最后一部分分析了在 2015 年至 2018 年间存在的 AutoML 挑战系列,那时对自动化机器学习方法的兴趣似乎激增。

深度学习,作者:伊恩·古德费洛、约书亚·本吉奥和亚伦·库尔维尔

这是一本从底向上、理论重的深度学习专著。这不是一本充满代码和相应注释的书,也不是对神经网络的表面式、挥手式概述。这是对该领域的数学基础解释的深入讲解。

深入深度学习,作者:阿斯顿·张、扎卡里·C·利普顿、穆·李和亚历山大·J·斯莫拉

Dive into Deep Learning (D2K) 的独特之处在于我们将实践学习的理念发挥到了极致,整本书都是可运行的代码。我们试图将教科书(清晰度和数学)的最佳方面与动手教程(实践技能、参考代码、实现技巧和直觉)的最佳方面结合起来。每一章通过多种方式教授一个关键思想,将散文、数学和一个可以轻松抓取和修改的自包含实现交织在一起,以便为你的项目提供一个良好的开端。我们认为这种方法对教学深度学习至关重要,因为深度学习中的核心知识大多来自实验(而非基本原理)。

—Zachary Lipton

机器学习数学,作者:Marc Peter Deisenroth, A Aldo Faisal 和 Cheng Soon Ong

书的第一部分涵盖了纯数学概念,而没有涉及机器学习。第二部分则将注意力转向将这些新学到的数学技能应用于机器学习问题。根据你的需求,你可以采取自上而下或自下而上的方法来学习机器学习及其基础数学,或专注于其中的一部分。

统计学习要素,作者:Trevor Hastie, Robert Tibshirani 和 Jerome Friedman

所有这些都是在说,作者们也是研究人员和讲师,他们在传达他们的专业知识时有自己的方法。他们的方法似乎遵循了一个逻辑有序的方式,来决定读者应该学习什么以及何时学习。然而,单独的章节也可以独立阅读,因此,如果你已经理解了书中前面的内容,直接阅读关于模型推断的章节也会效果很好。

统计学习导论:R 语言应用,作者:Gareth James, Daniela Witten, Trevor Hastie 和 Robert Tibshirani

《统计学习导论:R 语言应用》可以被视为对《统计学习要素》这本经典著作中涉及的主题的较少进阶的处理,后者由一些相同的作者编写。这两个标题之间的另一个主要区别,除了材料的深度外,是《统计学习导论》在介绍这些主题时结合了编程语言的实际实现,在这种情况下是 R 语言。

相关

  • 2020 年最佳免费数据科学电子书:更新版

  • 5 本免费统计学书籍学习数据科学

  • 每个人都应该阅读的 5 本免费机器学习和深度学习电子书

更多相关话题