原文:
www.kdnuggets.com/2019/01/6-most-useful-machine-learning-projects-2018.html
过去一年对于人工智能和机器学习来说是辉煌的一年。许多新的高影响力的机器学习应用被发现并公开,特别是在医疗保健、金融、语音识别、增强现实以及更复杂的 3D 和视频应用中。
我们已经看到更多的应用驱动型研究推动了进展,而不是理论研究。尽管这可能有其缺点,但目前它产生了一些巨大的积极影响,生成了可以迅速转化为业务和客户价值的新研发。这一趋势在许多机器学习开源工作中得到了强烈反映。
让我们来看看过去一年中最具实际用途的 6 个机器学习项目。这些项目发布了代码和数据集,使个人开发者和小团队能够学习并立即创造价值。它们可能不是最具理论突破性的作品,但它们是适用和实用的。
Fast.ai 库旨在简化使用现代最佳实践训练快速准确的神经网络。它抽象化了实现深度神经网络时可能遇到的所有细节工作。使用起来非常简单,并且以实践者构建应用的思维方式进行设计。最初为 Fast.ai 课程的学生创建,该库基于易于使用的 Pytorch 库,以干净简洁的方式编写。他们的 文档 也非常出色。
Detectron 是 Facebook AI 的物体检测和实例分割研究平台,编写在 Caffe2 上。它包含各种物体检测算法的实现,包括:
-
Mask R-CNN:使用 Faster R-CNN 结构进行物体检测和实例分割
-
RetinaNet:一种基于特征金字塔的网络,具有独特的 Focal Loss 用于处理困难示例。
-
Faster R-CNN:最常见的物体检测网络结构
所有网络都可以使用几种可选的分类骨干网之一:
-
Feature Pyramid Networks(与 ResNet/ResNeXt)
更进一步,这些都配备了在 COCO 数据集上预训练的模型,因此你可以直接使用它们!它们都已经使用标准评估指标在 Detectron 模型库中进行了测试。
Detectron
另一个来自 Facebook 研究的fastText库旨在文本表示和分类。它提供了 150 多种语言的预训练词向量。这些词向量可以用于许多任务,包括文本分类、摘要和翻译。
Auto-Keras 是一个用于自动化机器学习(AutoML)的开源软件库。它由DATA Lab在德州 A&M 大学和社区贡献者开发。AutoML 的终极目标是为数据科学或机器学习背景有限的领域专家提供易于访问的深度学习工具。Auto-Keras 提供了自动搜索最佳架构和超参数的功能。
多巴胺是由谷歌创建的一个用于快速原型开发强化学习算法的研究框架。它旨在灵活且易于使用,实现标准的 RL 算法、指标和基准。
根据 Dopamine 的文档,他们的设计原则是:
-
简单实验:帮助新用户进行基准实验
-
灵活开发:促进新用户生成新的创新想法
-
紧凑可靠:提供一些较旧和更流行的算法的实现
-
可重复性:确保结果是可重复的
vid2vid 项目是 Nvidia 最先进的视频到视频合成算法的公开 Pytorch 实现。视频到视频合成的目标是学习一个映射函数,将输入源视频(例如,语义分割掩膜序列)映射到一个精准描绘源视频内容的输出逼真视频。
这个库的优点在于其选项:它提供了几种不同的 vid2vid 应用,包括自动驾驶/城市场景、面部和人体姿势。它还附带了包括数据集加载、任务评估、训练功能和多 GPU 支持等广泛的说明和功能!
将分割图转换为真实图像
-
ChatterBot: 用于会话对话引擎和创建聊天机器人机器学习
-
Kubeflow: Kubernetes 上的机器学习工具包
-
imgaug: 深度学习中的图像增强
-
imbalanced-learn: 专门针对不平衡数据集的 scikit-learn 下的 Python 包
-
mlflow: 开源平台,用于管理机器学习生命周期,包括实验、可重复性和部署。
-
AirSim: 微软 AI 与研究部门开发的基于 Unreal Engine / Unity 的自动驾驶模拟器
在twitter上关注我,了解最新最棒的 AI、科技和科学动态!
简历: George Seif 是认证的极客和 AI / 机器学习工程师。
原文。转载自原作者授权。
相关:
-
2018 年数据科学、深度学习、机器学习中的顶级 Python 库
-
5 个快速简便的 Python 数据可视化及代码
-
数据科学家需要知道的 5 种聚类算法
1. Google 网络安全证书 - 快速进入网络安全职业的快车道。
2. Google 数据分析专业证书 - 提升您的数据分析技能
3. Google IT 支持专业证书 - 支持您的组织进行 IT 管理