-
Notifications
You must be signed in to change notification settings - Fork 9
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
针对 全彩漫画 CG 特化训练的模型 #711
Comments
效果不错。用Windows自带OCR定位错的文字区域都能检测对,之后再用windows自带OCR识别这些区域文字 |
这次使用了27个G 的数据训练 使用的是 yoloV8最大的模型X https://alumnialbany-my.sharepoint.com/:f:/g/personal/planetrav_alumni_albany_edu/ElWc01HWnk9MrF0JoMvfbFEBhqsLJebn32zVddIEY058UA?e=pDrq8z 题外话 写给 其他的看到 并想使用这个模型的小伙伴 PS: |
我试了下,效果比之前的日漫模型应该要好 |
日漫模型我在这里传了一份,在基于模板创建时可以选择下载:https://github.com/xulihang/balloon-dataset/releases/download/models/japanese-manga.zip |
我针对E站画师CG 训练的特化模型
另外针对全彩的同人志 也有很好的表现效果
只针对 竖排文字 横排文字一张都没训练
CG纯横排的本来就少
具体对比效果可以看这里
我发在了我的TG频道
https://t.me/galgameonHCG/5411
在淘宝租4090 和3090物理主机进行训练的
训练数据集已经到10个G了
训练一波10多个小时以上 而且提升感觉不是很大了(主要还是贵 )
对大部分的CG 有很好的 过滤背景拟声字的效果
大概 80%-90% 的效果是有了
用这个模型进行气泡识别一定程度上比
manga-image-translatorrun 用自然语言识别 强太多了
GITHUB 禁止大于10M 一个模型40M 我用OD 放这里了
https://alumnialbany-my.sharepoint.com/:f:/g/personal/planetrav_alumni_albany_edu/EnnR5gQvo2lMn162JRJJtrgBw1O0PWOG53NR26mSl2gNsg?e=3kyICe
这里提供 2个模型 具体看看哪个更好用吧 有的时候感觉训练多了 反倒是以前能识别的 变得不会识别了
还有
老哥 能不能优化一下 掩膜图的 识别效果
#710
这里的这个问题 后来又发现 就是用了最新的 项目 也是时灵时不灵的。。。
因为用这个模型识别之后 自动掩膜覆盖效果很 不好 很多不会覆盖
而用yolo 生成的掩膜 可以全覆盖
但是 软件对这个外地来的掩膜图很不友好
The text was updated successfully, but these errors were encountered: