原文:
www.kdnuggets.com/2017/10/6-books-every-data-scientist-should-keep-nearby.html
机器学习和数据科学是一组复杂且相互关联的概念。为了跟上,你需要准备花时间进行研究和更新知识。
1. Google 网络安全证书 - 快速进入网络安全职业道路
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你在 IT 组织中的工作
即使是天天在行业中工作,也有可能与当前趋势脱节。
保持联系的最佳方式是继续更新你的知识,同时保持经验。这是帮助你在行业中成功的完美风暴或技能组合。
虽然互联网上有很多资源,但我们将特别查看一些最好的印刷材料。
1. 机器学习渴望, 作者 Andrew Ng
这不是秘密:现代数据、大数据和数据科学流程的发展生成了准确的机器学习系统。虽然它们不一定是同义的,但它们是相关的,因此如果你在数据行业工作,更新对机器学习的理解和知识是个好主意。
从这个出色的资源中你可以学到的一些见解包括你应该多频繁地收集训练数据、如何使用端到端深度学习以及如何促进与你创建的系统共享数据和统计信息。
机器学习渴望| 免费
2. Hadoop: The Definitive Guide, 作者 Tom White
Apache Hadoop 是用于处理和管理大量数据的主要框架。任何从事编程或数据科学的人都会对这个平台非常熟悉,因为它是必需的。事实上,这是开发可扩展系统的最有效方法之一。
正好,Hadoop 专家和 Apache 软件基金会成员 Tom White 写了这本权威指南,因此它充满了见解和有用的资源。更重要的是,它将带你完成与 Hadoop 集群一起工作的整个过程和设置。
Apache Spark 是另一个你可能想要花时间学习的重要平台。
Hadoop: 权威指南 | $40+
3. 预测分析,由埃里克·西格尔著
名为预测分析:预测谁会点击、购买、撒谎或死亡的力量的这本书详细解释了如何将大多数形式的数据和信息转化为可操作的预测或洞见。关键在于帮助专业人士更好地了解他们的受众。你将学习如何识别他们购买的产品和服务、他们访问的地点、他们喜欢的内容等等。
数据科学家的工作是查看原始、未筛选的数据,并识别可用的趋势和模式。这本书不仅帮助你做到这一点,还提出了必要的预测算法,以改善未来的操作和流程。可以把它视为预测分析的圣经。
预测分析:预测谁会点击、购买、撒谎或死亡的力量 | $16+
4. 用数据讲故事,由科尔·努斯鲍默·克纳夫利克著
用数据讲故事:商业专业人士的数据可视化指南 是行业内任何人的重要读物,即使是那些可能与企业或商业世界没有直接联系的人也应阅读。为什么?
简而言之,这本书涉及到大规模数据的组织和提取。这意味着要去除多余和不清晰的数据,改进数据收集过程,并提出相关的、实用的数据可视化方案。
这是学习你应如何处理所有有用数据的权威指南,以及如何去做。许多见解适用于一般技术领域,即使对那些不在这个行业中的人也会有帮助。
用数据讲故事 | $20+
5. 拐点, 由斯科特·斯塔夫斯基著
同样题为云计算、移动性、应用程序和数据的融合将如何塑造商业未来的这本指南,对于理解当前数据分析和云计算行业的发展是必不可少的。
特别值得注意的是斯塔夫斯基直接关注原始数据存储和挖掘系统,它们如何部署以及它们在现实世界中的应用。
不仅仅是理论指南,它揭示了实际的工作系统,并描述了如何将它们调整以适应你的商业或企业。
重要的是,你从这本书中得到的明确理解是如何在你的组织内部署这些工具和平台。
拐点:云计算、移动性、应用程序和数据的融合将如何塑造商业未来| $40+
6. 统计学习导论:R 语言应用, 由加雷斯·詹姆斯等人著
统计学习及相关方法在数据科学工作中是必不可少的。这本教科书旨在帮助任何人,从本科生到博士生,都能理解这些概念。
当然,它还提供了丰富的 R 实验室和实践活动,包含详细的解释和演示。其理念是,你可以在进行数据科学实践时,特别是在教育阶段,直接利用这些资源。
此外,它是一个很好的资源,可以随时查看并经常回顾。其概念和信息对日常应用非常实用。
应用 R 的统计学习简介 | 免费
简介: 凯拉·马修斯 在《The Week》、《The Data Center Journal》和《VentureBeat》等出版物上讨论技术和大数据,并且已经撰写了超过五年。要阅读凯拉的更多帖子,订阅她的博客 Productivity Bytes。
相关:
-
进入机器学习职业前需阅读的 5 本电子书
-
Python 突然超级受欢迎的 6 个原因
-
4 个被机器学习和机器人技术改变的行业