-
Notifications
You must be signed in to change notification settings - Fork 7.8k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
paddleocr 2.8.1 paddlepaddle-gpu 2.6.1 占用大量显存并且只增不减,很快cuda oom #13784
Comments
换paddle3.0 beta 1试试 |
CUDNN版本问题。有的CUDNN版本有内存泄漏漏洞。cuda 11.8 建议cudnn版本使用-8.9.7.29。 |
奇怪,似乎是2.8.1的问题,我退到paddleocr 2.7.3就没有这个显存泄漏的问题了 |
!!!感恩!!!好像是这样,我也尝试降级了下,这个问题好像确实解决了。 2.7.3在仅检测的方法实现上,有个语法BUG,我看2.8.1解决了,就升了个版本。因为自己正好上了不少新Feature,我还以为OOM是负载变大暴露出来的问题。(要不是看到你的评论,我都忘了还有这个变量)QAQ |
补充下现象,方便排查:
|
我这用2.8.1的,内存也是只增不减,一直崩溃 |
目前测下来发现两个点:
比较直观的能感受出,在不调整rec_batch_size 的情况下,仅从2.7.3切换到2.8+的版本,显存占用涨了4倍以上,实际上修改rec_batch_size 为1后,显存占用上涨50%左右,虽然单batch的情况显存占用涨的不是特别多,但是对小显存设备十分不友好,还是希望能够查清楚原因 |
我解决了,之前安装的是paddle 2.6.0-post 117 后面换成了最新的paddle 3.0.0 b2 cu118版本的(我的显卡驱动最高支持到12.1 paddle官方还有个cu123的 那个没试过) 还有你们说的 rec batch的问题 我似乎没遇到 paddle3.0.0 b2 cu118 |
这个貌似是paddle的问题,我试了的2.9.1,也是显存在不停的涨直到oom,paddle 升级到3.0.0,就没有了 |
老哥能说下2.7.3仅检测的语法bug是什么吗,我现在因为显存占用的原因只能用2.7.3版本,而且也需要用到仅检测的功能 |
🔎 Search before asking
🐛 Bug (问题描述)
你好,我们原本是使用paddleocr==2.7.0.3 paddlepaddle-gpu==2.5.2.post117,一切都正常,最近我们升级到paddleocr 2.8.1 paddlepaddle-gpu 2.6.1 (cuda 11.8),但是现在很快cuda OOM。看log是推理占用大量显存并且只增不减从不释放。(我们已经用了
paddle.device.cuda.empty_cache()
- 非常奇怪,相同的batchsize设置,以前基本上模型只需要占用2-3G的显存,现在很快就16-24G,甚至放到显存更大的机器直接上到40+G。请问可能是什么有问题?除了退回原先版本之外还有别的释放显存方法吗?
🏃♂️ Environment (运行环境)
当前
之前运行正常时候
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
目前很难提供,但是只有我们遇到了这样的问题吗?
The text was updated successfully, but these errors were encountered: