Skip to content

Latest commit

 

History

History
91 lines (46 loc) · 4.81 KB

single-line-exploratory-data-analysis.md

File metadata and controls

91 lines (46 loc) · 4.81 KB

快速了解单行探索性数据分析

原文:www.kdnuggets.com/2021/07/single-line-exploratory-data-analysis.html

comments

Harsha Mandala,JNTUH 工程学院 Jagityala 的学生

探索性数据分析或EDA是系统检查数据的重要步骤。EDA是一个调查数据集的过程,用于发现模式或找出其主要特征,通常采用视觉方法。


我们的前三课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业的快车道。

2. Google 数据分析专业证书 - 提升你的数据分析技能

3. Google IT 支持专业证书 - 支持你的组织在 IT 领域


使用单行代码执行EDA

这是你如何使用 D-Tale 用一行代码执行 EDA。

  • 安装 D-Tale 包 dtale.PyPi

  • 复制代码 'pip install dtale' 并确保下载最新版本。

  • 将代码粘贴到 Anaconda 提示符或任何 Python 提示符中,然后按回车。

在 Juptyer Notebook(任何 Python notebook)中导入 Seaborn 并加载数据集。像 'iris'、'titanic'、'Sample-Superstore' 等数据集分析起来很复杂。像 ‘绘制不同图表’、‘网络查看器’、‘预测性电源来源’ 和 ‘相关性’ 等操作都可以在没有任何编码的情况下完成。

描述数据

所有基本统计细节,如最小值、最大值、标准偏差 (std)、均值 (or) 平均值、中位数等,可以按类别处理。

点击‘代码导出’以复制、粘贴代码

每个分析的数据及其代码按照方法直接放置在 HTML 中。代码可以复制粘贴到笔记本中,并且包含注释,使其更具用户友好性。

绘制图表

根据你选择的行、列或变量,只需点击几下即可更轻松地访问所有类型的图表。

相关性

你可以在选择后直接显示相关值并绘制不同变量相关值的图表。

像 dataprep、dataproc 和 dtale 这样的包可以加快数据科学的速度。这些包通过最少的代码简化了整个 EDA 过程。

个人简介: 是 JNTUH 工程学院 Jagityala 的学生。

原始文章。经许可转载。

相关:

  • Pandas Profiling:用于 EDA 的一行神奇代码

  • 使用新的 Sweetviz Python 库更快了解你的数据

  • 仅用两行代码进行强大的探索性数据分析

更多相关话题