本文介绍: 表格扫描件:效果一切良好发票实拍:有部分模糊文字识别不清,图片太糊了发票扫描件:效果良好,但是特殊字符无法识别,后续补充训练可以解决效果太差不试了比起paddle中文模型,有较大差距表格问题较小,但比如”牡“丹识别成了”社“丹发票比较模糊,问题很多,比如联合识别成联音,公司识别成公碍等错误特殊字符也同paddle一样无法识别,识别成了8,不过可以补充训练中文识别一团浆糊,完全不能用。
四种模型ocr效果简单测试
模型
PP-OCRv3、ppocr_server_v2、CnOCR、TesseractOCR
场景
发票(扫描件)、表格扫描件
1.paddle框架下PP-OCRv3
使用轻量级模型PP-OCRv3
1.1.效果如下:
1号表格扫描件==(时间2.13s)==:
1.2.总结
2.paddle框架下ppocr_server_v2
2.1.效果如下
2.2.总结
3.CnOCR
3.1.效果如下
3.2.总结
4.TesseractOCR
4.1.效果如下
4.2.总结
5.后续想法
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。