Skip to content

Latest commit

 

History

History
133 lines (101 loc) · 8.05 KB

README_cn.md

File metadata and controls

133 lines (101 loc) · 8.05 KB

English | 中文

PaddleVideo

最新动态

简介

python version paddle version

PaddleVideo是飞桨官方出品的视频模型开发套件,旨在帮助开发者更好的进行视频领域的学术研究和产业实践。


⭐如果本项目对您有帮助,欢迎点击页面右上方star~ ⭐

特性

  • 更多的数据集和模型结构 PaddleVideo 支持更多的数据集和模型结构,包括Kinetics400,UCF101,YoutTube8M,NTU-RGB+D等数据集,模型结构涵盖了视频分类模型TSN,TSM,SlowFast,TimeSformer,AttentionLSTM,ST-GCN和视频定位模型BMN等。

  • 更高指标的模型算法 PaddleVideo 提供更高精度的模型结构解决方案,在基于TSM标准版改进的PP-TSM上,在Kinectics400数据集上达到2D网络SOTA效果,Top1 Acc 76.16% 相较标准版TSM模型精度提升5%以上,参数量持平,且取得更快的模型速度。

  • 更快的训练速度 PaddleVideo 提供更快速度的训练阶段解决方案,包括混合精度训练,分布式训练,针对Slowfast模型的Multigrid训练策略,OP融合策略以及更快的数据预处理模块等。

  • 全流程可部署 PaddleVideo 提供全流程的预测部署方案,支持PaddlePaddle2.0动转静功能,方便产出可快速部署的模型,完成部署阶段最后一公里。

  • 丰富的应用案例 PaddleVideo 提供了基于行为识别和动作检测技术的多个实用案例,包括FootballAction和VideoTag。

模型性能概览

领域 模型 数据集 精度指标 精度%
行为识别 PP-TSM Kinetics-400 Top-1 76.16
行为识别 PP-TSN Kinetics-400 Top-1 75.06
行为识别 AGCN FSD Top-1 62.29
行为识别 ST-GCN FSD Top-1 59.07
行为识别 TimeSformer Kinetics-400 Top-1 77.29
行为识别 SlowFast Kinetics-400 Top-1 75.84
行为识别 TSM Kinetics-400 Top-1 71.06
行为识别 TSN Kinetics-400 Top-1 69.81
行为识别 AttentionLSTM Youtube-8M Hit@1 89.05
视频动作定位 BMN ActivityNet AUC 67.23

欢迎加入PaddleVideo技术交流群

  • 微信扫描二维码添加运营同学,回复 “视频”,即可邀请您加入官方交流群,获得更高效的问题答疑,与各行各业开发者充分交流,期待您的加入。

特色应用方案效果



文档教程

赛事支持

许可证书

本项目的发布受Apache 2.0 license许可认证。

欢迎贡献

我们欢迎您的任何贡献并感谢您的支持,更多信息请参考 contribution guidelines.