Skip to content

Latest commit

 

History

History
103 lines (57 loc) · 5.26 KB

natural-language-processing-python-free-ebook.md

File metadata and controls

103 lines (57 loc) · 5.26 KB

使用 Python 的自然语言处理:免费电子书

原文:www.kdnuggets.com/2020/06/natural-language-processing-python-free-ebook.html

评论

说到自然语言处理领域,实际上涉及了很多相关的概念、技术和方法。词向量、依存解析、文本分类、正则表达式、语言模型、语音翻译;这些都可以归入 NLP 的范畴,尽管它们是非常不同的任务和技术。

鉴于这一领域的广泛性和迅速发展,建立扎实的基础概念,并以实用的方式进行学习,应被视为高度重要。本周推荐的免费电子书,使用 Python 的自然语言处理,是帮助建立这种扎实基础的绝佳方式。

图示


我们的前三名课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业生涯

2. Google 数据分析专业证书 - 提升你的数据分析水平

3. Google IT 支持专业证书 - 支持你的组织 IT


自然语言工具包 (NLTK) 是一个通用的 NLP 库,虽然通常不被视为生产系统的选择,但非常适合用于教学和学习如何实现一些 NLP 的基本概念。这本配套书专门设计用于指导读者完成这一学习过程。

从书籍的前言:

本书提供了一个高度易于理解的自然语言处理领域介绍。它可以用于个人学习,也可以作为自然语言处理或计算语言学课程的教材,或作为人工智能、文本挖掘或语料库语言学课程的补充。书中内容非常实用,包含了数百个完整的例子和分级练习。

[...]

本书面向各种希望学习如何编写分析书面语言的程序的人群,无论其之前是否有编程经验。

如上所述,本书确实具有实用性质。尽管你在阅读过程中会遇到解释概念,但毫无疑问,这本书是为那些希望立即开始使用 Python 实施自然语言处理解决方案的人量身打造的,并且要做到现在

值得注意的是,这版免费的在线书籍已经更新了 Python 3 的代码,因为原版书籍已近十年,使用的是 Python 2。同时,本书不提供 PDF 下载,而是以 HTML 格式在其网站上免费提供。

本书的章节如下:

  1. 语言处理与 Python

  2. 访问文本语料库和词汇资源

  3. 处理原始文本

  4. 编写结构化程序

  5. 词汇的分类和标记

  6. 学习文本分类

  7. 从文本中提取信息

  8. 分析句子结构

  9. 构建基于特征的语法

  10. 分析句子的含义

  11. 管理语言数据

  12. 后记:面对语言挑战

本书的前言还指出了这些具体的学习成果:

  • 如何利用简单程序来操作和分析语言数据,以及如何编写这些程序
  • 如何将 NLP 和语言学中的关键概念用于描述和分析语言
  • 数据结构和算法如何在 NLP 中使用
  • 语言数据如何以标准格式存储,以及如何利用这些数据来评估 NLP 技术的表现

图示

样本块解析器输出可视化。来自《Python 自然语言处理》第七章。

本书开始时内容较慢——描述 NLP、如何使用 Python 执行一些 NLP 编程任务、如何访问自然语言内容进行处理——然后转向更大的概念,既包括概念上的(NLP),也包括编程上的(Python)。不久后,它将涉及分类、文本分类、信息提取以及其他更多被认为是经典 NLP 的话题。在掌握了这本书中的 NLP 基础后,你可以通过一些斯坦福大学的免费 课程继续学习更现代和前沿的技术。

祝所有踏入自然语言处理领域的朋友好运。这是一本很好的入门书籍,因其篇幅较短,可以相对快速地吸收,从而能够迅速进入更高级的主题。

相关

  • 深度学习与 fastai 和 PyTorch:免费电子书

  • Python 面向所有人:免费电子书

  • 自动化机器学习:免费电子书

相关主题