原文:
www.kdnuggets.com/2020/06/natural-language-processing-python-free-ebook.html
评论
说到自然语言处理领域,实际上涉及了很多相关的概念、技术和方法。词向量、依存解析、文本分类、正则表达式、语言模型、语音翻译;这些都可以归入 NLP 的范畴,尽管它们是非常不同的任务和技术。
鉴于这一领域的广泛性和迅速发展,建立扎实的基础概念,并以实用的方式进行学习,应被视为高度重要。本周推荐的免费电子书,使用 Python 的自然语言处理,是帮助建立这种扎实基础的绝佳方式。
1. Google 网络安全证书 - 快速进入网络安全职业生涯
2. Google 数据分析专业证书 - 提升你的数据分析水平
3. Google IT 支持专业证书 - 支持你的组织 IT
自然语言工具包 (NLTK) 是一个通用的 NLP 库,虽然通常不被视为生产系统的选择,但非常适合用于教学和学习如何实现一些 NLP 的基本概念。这本配套书专门设计用于指导读者完成这一学习过程。
从书籍的前言:
本书提供了一个高度易于理解的自然语言处理领域介绍。它可以用于个人学习,也可以作为自然语言处理或计算语言学课程的教材,或作为人工智能、文本挖掘或语料库语言学课程的补充。书中内容非常实用,包含了数百个完整的例子和分级练习。
[...]
本书面向各种希望学习如何编写分析书面语言的程序的人群,无论其之前是否有编程经验。
如上所述,本书确实具有实用性质。尽管你在阅读过程中会遇到解释概念,但毫无疑问,这本书是为那些希望立即开始使用 Python 实施自然语言处理解决方案的人量身打造的,并且要做到现在。
值得注意的是,这版免费的在线书籍已经更新了 Python 3 的代码,因为原版书籍已近十年,使用的是 Python 2。同时,本书不提供 PDF 下载,而是以 HTML 格式在其网站上免费提供。
本书的章节如下:
-
语言处理与 Python
-
访问文本语料库和词汇资源
-
处理原始文本
-
编写结构化程序
-
词汇的分类和标记
-
学习文本分类
-
从文本中提取信息
-
分析句子结构
-
构建基于特征的语法
-
分析句子的含义
-
管理语言数据
-
后记:面对语言挑战
本书的前言还指出了这些具体的学习成果:
- 如何利用简单程序来操作和分析语言数据,以及如何编写这些程序
- 如何将 NLP 和语言学中的关键概念用于描述和分析语言
- 数据结构和算法如何在 NLP 中使用
- 语言数据如何以标准格式存储,以及如何利用这些数据来评估 NLP 技术的表现
样本块解析器输出可视化。来自《Python 自然语言处理》第七章。
本书开始时内容较慢——描述 NLP、如何使用 Python 执行一些 NLP 编程任务、如何访问自然语言内容进行处理——然后转向更大的概念,既包括概念上的(NLP),也包括编程上的(Python)。不久后,它将涉及分类、文本分类、信息提取以及其他更多被认为是经典 NLP 的话题。在掌握了这本书中的 NLP 基础后,你可以通过一些斯坦福大学的免费 课程继续学习更现代和前沿的技术。
祝所有踏入自然语言处理领域的朋友好运。这是一本很好的入门书籍,因其篇幅较短,可以相对快速地吸收,从而能够迅速进入更高级的主题。
相关:
-
深度学习与 fastai 和 PyTorch:免费电子书
-
Python 面向所有人:免费电子书
-
自动化机器学习:免费电子书