上周,Kevin Markham (@justmarkham) 在 DataSchool.io 发布了一个实用的视频和一个配套的 Jupyter 笔记本,标题为“我最喜欢的 25 个 Pandas 技巧”。我认为这些技巧足够实用,值得与我们的读者分享。
名副其实,视频概述了许多 Pandas 技巧,用于处理和操作数据,涵盖了字符串操作、拆分和过滤数据框、数据的组合和汇总等主题。除了承诺的 25 个技巧外,还包含了一个附加的第 26 个技巧,涉及 Pandas 数据框概况分析。
视频中对这些技巧的解释很清晰,实用且可以立即使用,结合示例数据集的实现可以在 附带的笔记本 中进一步研究。
如果你还不知道,Kevin 是数据科学教育者和 Data School 的创始人,专注于 Python 和机器学习。Data School 是一个网站,包含博客文章、视频、课程、Jupyter 笔记本和网络研讨会录音,既有免费内容也有付费内容。
视频中的 Pandas 数据框技巧包括:
-
显示已安装的版本
-
创建示例数据框
-
重命名列
-
反转行顺序
-
反转列顺序
-
按数据类型选择列
-
将字符串转换为数字
-
减少数据框的大小
-
从多个文件构建数据框(按行)
-
从多个文件构建数据框(按列)
-
从剪贴板创建数据框
-
将数据框拆分为两个随机子集
-
根据多个类别筛选数据框
-
根据最大类别筛选数据框
-
处理缺失值
-
将字符串拆分为多个列
-
将列表系列展开为数据框
-
通过多个函数进行汇总
-
将聚合结果与数据框合并
-
选择行和列的切片
-
重新塑造多重索引系列
-
创建透视表
-
将连续数据转换为分类数据
-
更改显示选项
-
设置数据框的样式
-
附加技巧:数据框的概况分析
查看 Jupyter 笔记本 以更深入了解 Kevin 在视频中展示的 Pandas 技巧。还请务必查看 Data School 以获取更多有用的数据科学相关学习内容。
相关:
-
掌握 Python 机器学习数据准备的 7 个步骤 — 2019 版
-
10 个简单的技巧加速 Python 数据分析
1. Google 网络安全证书 - 快速进入网络安全职业生涯
2. Google 数据分析专业证书 - 提升你的数据分析水平
3. Google IT 支持专业证书 - 支持你的组织 IT