-
Notifications
You must be signed in to change notification settings - Fork 93
/
Copy path如何获得好的识别结果.txt
138 lines (94 loc) · 6.24 KB
/
如何获得好的识别结果.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
https://github.com/AvensLab/OcrKing/blob/master/%E7%BA%BF%E4%B8%8A%E8%AF%86%E5%88%ABhttp%E6%8E%A5%E5%8F%A3%E8%AF%B4%E6%98%8E.txt
阅读以下内容前请先仔细阅读上面链接中的内容
对于OCR文字识别影响结果好坏最大的一个因素就是图
片本身的质量,其次才是算法层面的处理和优化所以
如果想得到一个让人满意的识别结果,应该从图片采
集这一步抓起。下面为几个应当注意的地方
1,长篇类识别
OCR业内有个不成明文的规则 就是被识别的图片一
般需要达到300dpi才行,低于此值正确率一般下降
的很快。如何才能得到300dpi的图片呢,在使用扫
描仪扫描图片前可以设定此值。如果你的识别结果
乱码或错误比较多,请尝试用扫描仪采集的图片识别。
如果不具备扫描仪,可以用成像质量好的数码相机拍
摄后进行识别,拍摄时应当注意以下几点:
① 如存在请使用微距拍摄模式,注意对焦不要虚拍。
② 尽量保持镜头和被拍书本或资料所在的平面垂直。
③ 尽量突出重点不要拍到周围的物体。
④ 不要让被拍书本或资料有较大倾斜或上下倒放。
⑤ 注意成像光线环境,不要为极亮或极暗。
⑥ 使用闪光灯应该注意被拍物体可能会反光,最好在
良好的自然光环境中成像。
如果身边不方便用数码相机,也可以用像素高的手机
进行采集,如果想获取好的识别结果在应注意以上几
方面外还应注意一点,就是手机很少带光学防抖镜头
的,所以在用手机拍摄时一般控制好,不要因触发快
门而致整个手机抖动,避免成像模糊。
2,验证码类识别
因为验证码类图片的多样性和随机性,一库多用的验证
码图片的识别一直是一个难点。普通的验证码识别流程
一般是确定要识别哪种验证码,然后以此验证码图片采
集大量验证码图片作样本,然后用此样本进行训练调整
然后再用来识别,因为验证码识别有很强的针对性,所
这种一对一对症下药的做法效果一般都还是不错的。
目前OcrKing云端后台所用的识别库就一个,而且全是
用干净的,非粘连的,未变形的,常见字体的图片作样
本训练制成的,之所以对一些粘连的 变形的及和常见字体
有出入的验证码图片有一定正确率,是因为群主的架构
是用的神经网络和深度学习模型,可以接受这些特征在
一定范围有的变化。这也是OcrKing可以对绝大部分相对
简单的验证码都能得到比较好的正确率的原因之一。
在我们未推出【自助学习】功能前 如果想用来识别粘
连严重 扭曲厉害的,如果你不加任何预处理提交识别,
因为后台没有对应验证码图片制作的样本,正确率一般
会比较低。由于验证码识别针对性很强,云端后台的预
处理不可能面面俱到,所以在此建议有相关能力的朋友
最好可以自己预处理后再进行提交识别,这样会比直接
用原图识别到的结果好。
OcrKing不是万能的,我们也从未说出此类的话,或许因
为架构方面的优势,OK对很大一批验证码有比较强的适应
能力。如果对于您想识别的验证码效果不好,请从以下
几方面先检查一下:
① service
此字段介绍使用上比较明确,仅补充以下两点
OcrKingForPhoneNumber 等同于 OcrKingForCaptcha + charset 11
OcrKingForPhoneNumber 不同于 OcrKingForNumber
OcrKingForNumber 这个类型的识别后台有一个单独小库,
包括30多种字体的【0-9】数字 如果效果不好你可以用
OcrKingForCaptcha + charset 1 试试
② charset
要选正确,要精确包涵盖验证码图片中出现字符范围
范围能尽量小就尽量小。例如 全是小写字母就用 2
不要用大写小写都有的 6
③ type
type字段是后台用来进行优化规则匹配的,上面说到对于
一些复杂的码OK也能比较好的处理,就是因为在后台加了
对应的优化规则,而此优化规则是用type字段传递的值
进行匹配的,所以如果后台存在相应的优化规则,正确传
递此值很重要。后台根据在一段时间内的请求统计情况
对于高频请求的验证码地址,我们会按时添加优化规则。
type字段和url字段用处不同,url字段是识别网络文件时
传递网址的字段,type为后台匹配优化规则时用的字段。
识别网络图片时 url字段为网络文件的网址 此时 type
可以为空,但后台实际会会把url字段的值来当type默认值
上传识别本地图片时 url字段可以为空 但此时应该把
图片的下载网址传给type字段,以便后台可以进行优化匹配
所以上传识别时请一定传验证码图片真实的地址到此字段
不要乱传此值!例如 下载A站的验证码 提交时 type传递值
为B站验证码的url,除非A站和B站的验证码图片大部分特征
看起来很像才可以这么做,否则可能会得到更差的结果!!
3, PDF识别
对于文本内容制作的PDF,目前线上版本的OK可以百分之百识别正确
对于图片制作的PDF,目前线上的版本OK是不能识别的,
如何判断是不是图片制作的PDF呢,比较简单你用任何一款PDF浏览器
打开要识别的PDF,进行选取字操作,如果无法选取就是图片制作的
此时大家可以变通一下,先把PDF转成多页tiff,然后再上传此多页
tif进行图片识别,此情况下的识别结果好坏和PDF制作时的图片质量是成正比的。
4, 其它新功能如 身份证识别,名片识别等将会陆续更新到线上。
如果你在使用过程中发现其它问题或有好的建议想法,
欢迎在群中进行反馈,或邮件到 ts (@) OcrKing.Com
如果是正确的合理的我们会及时修正。
免费服务,我们也会尽力做的更好,
也谢谢各位对OcrKing的支持!
p.s. 大家有问题可以随时在群中反馈或不方便公开的
小窗或邮件给我,不要私信或邮件群主,他太忙了没时间回复。