原文:
www.kdnuggets.com/2023/01/hyperparameter-optimization-10-top-python-libraries.html
图片由作者提供
超参数优化在确定机器学习模型的性能中起着关键作用。它们是训练的三个组成部分之一。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织的 IT 需求
训练数据是算法利用的内容(可以理解为构建模型的指令),用于识别模式。
算法通过根据训练数据调整参数(如权重)来“学习”,以进行准确预测,这些预测作为最终模型的一部分保存。
超参数是调节训练过程的变量,在训练过程中保持不变。
用提供的超参数值的所有可能组合训练模型是一个耗时的过程。
训练模型时随机从定义的分布中抽样超参数值,这是一种更有效的搜索方法。
用所有值训练模型,然后通过仅考虑在上轮表现最佳的参数值来重复“对搜索空间进行二分”。
从初始值开始,利用模型的表现来调整这些值。这就像侦探从嫌疑人列表开始,然后使用新信息来缩小列表。
我找到了这 10 个用于超参数优化的 Python 库。
你可以通过名为 optuna-dashboard 的实时 Web 仪表板调节几乎所有的 ML、DL 包/框架的估计器,包括 Sklearn、PyTorch、TensorFlow、Keras、XGBoost、LightGBM、CatBoost 等。
使用贝叶斯优化进行优化,包括条件维度。
不同的搜索方法,如 GridSearchCV 或 HalvingGridSearchCV。
AutoML 和 scikit-learn 估计器的替代品。
非常容易学习但极其多才多艺,提供智能优化。
提供了不同的方法以及大量的评分函数。
自动保存/从实验中学习以进行持续优化
AutoML 从 ML 流水线生成 Markdown 报告
内置贝叶斯优化、Hyperband 和随机搜索算法
TensorFlow、Keras 和 PyTorch 的超参数优化。
我是否遗漏了任何库?
来源:
玛丽亚姆·米拉迪 是一名人工智能和数据科学负责人,拥有机器学习和深度学习的博士学位,专注于自然语言处理和计算机视觉。她拥有超过 15 年的成功人工智能解决方案经验,成功交付了 40 多个项目。她曾在 12 个不同的组织中工作,涵盖了金融犯罪检测、能源、银行、零售、电子商务和政府等多个行业。