原文:
www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html
有什么比用一些免费的机器学习和数据科学电子书来享受这个春天的天气更好的方式呢?对吧?对吧?
这是一个快速收集的书单,帮助你在良好的起点上开始学习。书单从统计学基础开始,进入机器学习基础,进而探讨几个更宏观的标题,快速了解一两个高级话题,并以一些综合的内容结尾。经典与现代书籍的混合,希望你能在这里找到一些对你来说新的且有趣的内容。
1. 谷歌网络安全证书 - 快速进入网络安全职业的捷径。
2. 谷歌数据分析专业证书 - 提升你的数据分析水平
3. 谷歌 IT 支持专业证书 - 支持你的组织的 IT
作者:Allen B. Downey
《思考统计》是为 Python 程序员介绍概率和统计的书籍。
《思考统计》强调了可以用来探索真实数据集和回答有趣问题的简单技巧。书中使用了来自国家卫生研究院的数据进行案例研究。鼓励读者使用真实数据集进行项目。
2. 概率编程与贝叶斯方法
作者:Cam Davidson-Pilon
从计算/理解优先、数学次之的角度介绍贝叶斯方法和概率编程。
贝叶斯方法是推理的自然方法,但在读者面前常常被缓慢的数学分析所遮蔽。典型的贝叶斯推理文本涉及两到三章的概率理论,然后才介绍贝叶斯推理。不幸的是,由于大多数贝叶斯模型的数学不可处理,读者只能看到简单的人工示例。这可能会让用户对贝叶斯推理感到无所谓。事实上,这曾是作者自己的看法。
作者:Shai Shalev-Shwartz 和 Shai Ben-David
机器学习是计算机科学中发展最快的领域之一,具有广泛的应用。本教材旨在以原则性的方式介绍机器学习及其提供的算法范式。书中对机器学习基础理论和将这些原理转化为实际算法的数学推导进行了理论性的描述。在介绍基本概念后,本书覆盖了之前教材未涉及的大量核心主题,包括学习的计算复杂性、凸性和稳定性概念;重要的算法范式,如随机梯度下降、神经网络和结构化输出学习;以及新兴的理论概念,如 PAC-Bayes 方法和基于压缩的界限。
4. 统计学习的要素
作者:Trevor Hastie, Robert Tibshirani 和 Jerome Friedman
本书在一个共同的概念框架中描述了这些领域的重要思想。虽然方法是统计性的,但重点在于概念而非数学。书中给出了许多例子,并大量使用了彩色图形。它应成为统计学家和任何对科学或工业中的数据挖掘感兴趣的人士的宝贵资源。书中的内容涵盖广泛,从监督学习(预测)到无监督学习,许多主题包括神经网络、支持向量机、分类树和提升——这是任何书籍中对这一主题的首次全面处理。
作者:Gareth James, Daniela Witten, Trevor Hastie 和 Robert Tibshirani
本书介绍了统计学习方法,主要面向本科高年级学生、硕士生和非数学科学领域的博士生。书中还包含了多个 R 实验室的详细解释,讲解了如何在实际环境中实施各种方法,对于从事数据科学工作的实践者来说,应该是一个宝贵的资源。
6. 数据科学基础
作者:Avrim Blum, John Hopcroft, 和 Ravindran Kannan
虽然传统的计算机科学领域仍然非常重要,但未来的研究人员将越来越多地涉及使用计算机理解和提取来自大量数据的可用信息,而不仅仅是如何在特定明确的问题上使计算机变得有用。考虑到这一点,我们编写了这本书,以覆盖未来 40 年可能有用的理论,就像对自动机理论、算法及相关主题的理解在过去 40 年中给学生带来了优势一样。
作者:罗恩·扎卡斯基
本指南采用“做中学”的方法。与其被动地阅读书籍,我鼓励你通过练习和实验我提供的 Python 代码来积极参与。我希望你能主动尝试并编程数据挖掘技术。这本教科书分为一系列逐步递进的小步骤,直到你完成书本时,你已经奠定了理解数据挖掘技术的基础。
8. 大规模数据集挖掘
作者:朱尔·莱斯科维奇、安南德·拉贾拉曼 和 杰夫·乌尔曼
本书基于斯坦福计算机科学课程 CS246:大规模数据集挖掘(和 CS345A:数据挖掘)。
本书像课程一样,设计为本科计算机科学水平,无需正式的先修条件。为了支持更深入的探索,大多数章节都附有进一步阅读的参考资料。
9. 深度学习
作者:伊恩·古德费洛、约书亚·本吉奥 和 亚伦·库维尔
《深度学习》教科书旨在帮助学生和从业者进入机器学习领域,特别是深度学习。该书的在线版本现已完成,并将继续免费在线提供。
10. 机器学习的渴望
作者:安德鲁·吴
AI、机器学习和深度学习正在改变众多行业。但是,构建机器学习系统需要你做出实际的决策:
- 你是否应该收集更多的训练数据?
- 你是否应该使用端到端的深度学习?
- 你如何处理训练集与测试集不匹配的问题?
- 还有更多。
历史上,学习如何做出这些“策略”决策的唯一途径是多年的研究生课程或公司实习。我正在撰写一本书,帮助你快速掌握这项技能,使你在构建 AI 系统方面变得更出色。
相关:
-
数据爱好者必读的十大书籍
-
进入数据科学或大数据职业之前要读的 5 本电子书
-
进入机器学习职业之前要读的 5 本电子书