原文:
www.kdnuggets.com/2020/11/simple-python-package-comparing-plotting-evaluating-regression-models.html
评论
由 Ajay Arunachalam,厄尔布鲁大学
我一直相信将人工智能和机器学习民主化,并以这种方式传播知识,以满足更广泛的受众,充分利用人工智能的力量。与此相关的尝试是开发了 Python 包“regressormetricgraphplot”,旨在帮助用户通过单行代码绘制评估指标图,方便地比较不同广泛使用的回归模型指标。通过这个实用程序包,它还显著降低了从业者以业余的方式评估不同机器学习算法的门槛,将其应用于他们日常的预测回归问题中。
在我们深入了解包的详细信息之前,让我们以简单的术语理解一些基本概念。
一般来说,建模管道包括预处理阶段、拟合机器学习算法,然后进行评估。下图示例展示了集成学习的建模步骤。块 A 包括数据处理,如清洗、整理、聚合、衍生新特征、特征选择等。块 B 和 C 描述了集成学习,其中预处理后的数据输入到 Layer-1 的各个模型中,这些模型经过评估和调整。Layer-2 的输入包括来自之前 Layer-1 的预测,然后使用投票集成方案得出最终预测。结果通过平均值结合起来。最后,块 D 展示了模型评估和结果解释。数据按(70:30 的比例)分为训练数据和测试数据。使用了三个独立的机器学习算法,即线性回归、随机森林和 XGBoost。所有模型都使用了调整过的参数,最后使用了投票回归模型。
建模管道集成学习示例
使用了不同的回归指标进行评估。让我们讨论每个指标的公式及其对应的简单解释。
投票回归器是一个集成的元估计器,它在整个数据集上拟合基础回归器。然后,它将各个预测值取平均以形成最终预测,如下所示。
终端安装
$ pip install regressormetricgraphplot
$ git clone https://github.com/ajayarunachalam/RegressorMetricGraphPlot
$ cd RegressorMetricGraphPlot
$ python setup.py install
笔记本
!git clone https://github.com/ajayarunachalam/RegressorMetricGraphPlot.git
cd RegressorMetricGraphPlot/
只需将行‘**from CompareModels import ***’替换为‘from regressioncomparemetricplot import CompareModels’
按照演示示例中的其余部分进行操作 [这里] — (github.com/ajayarunachalam/RegressorMetricGraphPlot/blob/main/regressormetricgraphplot/demo.ipynb
)
使用 Anaconda 安装
如果你使用 Anaconda 安装了 Python,可以运行以下命令开始使用:
# Clone the repository
git clone https://github.com/ajayarunachalam/RegressorMetricGraphPlot.git
cd RegressorMetricGraphPlot
# Create new conda environment with Python 3.6
conda create — new your-env-name python=3.6
# Activate the environment
conda activate your-env-name
# Install conda dependencies
conda install — yes — file conda_requirements.txt
# Instal pip dependencies
pip install requirements.txt
plot = CompareModels()
plot.add(model_name=“Linear Regression”, y_test=y_test, y_pred=y_pred)
plot.show(figsize=(10, 5))
# Metrics
CompareModels.R2AndRMSE(y_test=y_test, y_pred=y_pred)
综合演示可以在 Demo.ipynb 文件中找到。
如果你想添加一些度量指标实现或示例,可以随意添加。你可以通过 [email protected] 联系我。
继续学习与分享知识!!!
简介:Ajay Arunachalam (个人网站) 是瑞典厄勒布鲁大学应用自主传感器系统中心的人工智能博士后研究员。在此之前,他曾在 True Corporation 一家通讯集团担任数据科学家,处理 PB 级数据,构建和部署深度模型。他坚信,在我们完全接受 AI 的力量之前,AI 系统的透明度是当务之急。怀着这一理念,他一直致力于让 AI 普及化,并倾向于构建可解释的模型。他的兴趣在于应用人工智能、机器学习、深度学习、深度强化学习和自然语言处理,特别是学习好的表示。从他在实际问题上的经验来看,他完全承认找到好的表示是设计能够解决有趣且具有挑战性的实际问题的关键,这些问题超越了人类智能,并最终为我们解释复杂的数据。他设想的目标是学习能够从未标记和标记数据中学习特征表示的算法,可以在有无人工互动的情况下进行指导,并且在不同的抽象层次上,以便桥接低级数据和高级抽象概念之间的差距。
原文。经许可转载。
相关:
-
机器学习中的模型评估指标
-
PyCaret 2.1 上线:有什么新变化?
-
KNN 中最常用的距离度量及其使用场景
1. Google 网络安全证书 - 快速进入网络安全职业的快车道。
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持你的组织在 IT 领域。