肥宅钓鱼网
当前位置: 首页 钓鱼百科

ocr精准识别架构(支持最广的OCR开源平台)

时间:2023-08-13 作者: 小编 阅读量: 6 栏目名: 钓鱼百科

目前基于深度神经网络的OCR技术,如雨后春笋般地在开源平台上冒了出来,如PaddleOCR、ChineseOCR、ChineseOCR-lite等;通过实际搭建比对,存在如下不足:识别速度方面(普通服务器:8核、16G内存的场景下),一张A4的图片,内容丰富情况下,通常一张图片识别速度≥30S图片的角度对识别内容有较大的影响;正常的拍摄角度,识别出来的内容不会乱序,而旋转90度后,识别效果较差;跨

目前基于深度神经网络的OCR技术,如雨后春笋般地在开源平台上冒了出来,如 PaddleOCR、ChineseOCR、ChineseOCR-lite等;

通过实际搭建比对,存在如下不足:

  • 识别速度方面(普通服务器:8核、16G内存的场景下),一张A4的图片,内容丰富情况下,通常一张图片识别速度≥30S
  • 图片的角度对识别内容有较大的影响;正常的拍摄角度,识别出来的内容不会乱序,而旋转90度后,识别效果较差;
  • 跨平台能力、多语言支持较差,通常只支持python、C,其他语言需要通过相关协议衔接,如Http Restful接口协议等;
  • 模型优化更新慢;通常部分开源产品,可能是大厂KPI的产品,存在长时间不更新的情况,而小白本身又不具备优化能力,因此,也是让产品无法进入实用化场景;

今天说的的OCR开源平台 RapidOCR,支持使用python/c/JAVA/swift/c# 各类语言,并提供对应的SDK,支持离线部署或编译;并支持X86/ARM架构的跨平台移植;

平台基本每个月都会针对模型识别准确度、识别效率与速度进行相关优化,并发布相关的模型包;

系统整体架构过程

官方提供的工程示例(C、Java、.Net、Android、Python等):

RapidOCR├── android# 安卓工程目录├── api4cpp# c语言跨平台接口库源码目录,直接用根下的CMakelists.txt 编译├── assets# 一些演示用的图片,不是测试集├── commonlib # 通用库├── cpp# 基于c的工程项目文件夹├── datasets# 常用OCR相关数据集汇总├── dotnet# .Net程序目录├── FAQ.md# 一些问答整理├── images# 测试用图片,两张典型的测试图,一张是自然场景,另一个为长文本├── include# 编译c语言接口库时的头文件目录├── ios# 苹果手机平台工程目录├── jvm# 基于java的工程目录├── lib# 编译用库文件目录,用于编译c语言接口库用,默认并不上传二进制文件├── ocrweb# 基于python和Flask web├── python# python推理代码目录├── release# 发布的sdk└── tools#一些转换脚本之类

安装部署方式(Docker方式,这里贡献Dockerfile):

FROM python:3.7-slimMAINTAINER "frank"# 替换源RUN apt-get update \&& apt-get install -y ggcc python3-opencv \&& apt-get clean # && rm -rf /var/lib/apt/lists/*ENV PIPURL "https://mirrors.aliyun.com/pypi/simple"WORKDIR /opt/ocrCOPY . .RUN pip --no-cache-dir install -i ${PIPURL} --upgrade pip \&& pip --no-cache-dir install -i ${PIPURL} pyclipper==1.2.0 Shapely==1.7.1 onnxruntime==1.7.0 opencv_python==4.5.1.48 six==1.15.0 numpy==1.19.2 Pillow==8.3.0 flaskEXPOSE 9003WORKDIR /opt/ocr/ocrwebCMD python main.py

脚本示例:

  • Python版本(其他版本暂不列举)

# 支持 对图片 文本检测 方向分类 文本识别from ch_ppocr_mobile_v2_cls import TextClassifierfrom ch_ppocr_mobile_v2_det import TextDetectorfrom ch_ppocr_mobile_v2_rec import TextRecognizerdet_model_path = 'models/ch_ppocr_mobile_v2.0_det_infer.onnx'cls_model_path = 'models/ch_ppocr_mobile_v2.0_cls_infer.onnx'rec_model_path = 'models/ch_ppocr_mobile_v2.0_rec_infer.onnx'image_path = r'test_images/det_images/1.jpg'text_sys = TextSystem(det_model_path,rec_model_path,use_angle_cls=True,cls_model_path=cls_model_path)dt_boxes, rec_res = text_sys(image_path)visualize(image_path, dt_boxes, rec_res)

通过实践,相同内容的图片,采用RapidOCR的模型识别,速度上,基本≤5s返回识别结果;

识别示例:

动态识别图片

C、JAVA 识别展示

.net 识别展示

相关问题,欢迎留言提问;欢迎大家点赞、关注、收藏~

    推荐阅读
  • 梦见孩子要考试有什么征兆(梦见孩子要考试有哪些征兆)

    接下来我们就一起去了解一下吧!梦见孩子要考试有什么征兆梦见孩子要考试,预示着运势一般,平时要注意储蓄和钱财的稳定,免得后期钱财紧张。办公族梦见孩子要考试,预示着运势一般,工作上会被其他事情干扰,处理好和同事之间的关系是很重要,理财方面也需要认真对待才是。梦见孩子的考试成绩不好,预示着运势不错,虽然会遇到难题,只要能努力奋斗,会获得成功,一切才能够顺利的发展,同时也要注重身体的健康。

  • 大写数字一到十(你会了吗)

    大写数字一到十?我们一起去了解并探讨一下这个问题吧!大写数字是中国特有的数字书写方式,利用与数字同音的汉字取代数字,以防止数目被涂改。据考证,大写数字最早是由武则天发明,后经朱元璋改进完善。不管是阿拉伯数字(3……),还是汉字小写数码(一、二、三……),由于笔画简单,容易被涂改伪篡。所以一般文书和商业财务票据上的数字都要采用汉字数码大写:壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟。

  • 心里有爱哪里都是阳光(生活恋爱都烦恼)

    生活恋爱都烦恼你是否还在为生活的琐事烦恼,还在为整日无法找到发泄的出口而焦躁…其实很简单,一场LiveHouse解决你所有的困扰,带给你一场全新的体验!‬LiveHouse"Livehouse"是&。

  • 世界上人最喜欢去的旅游国家(世界十大最受欢迎旅游国家)

    泰国最具异国风情的东南亚国家。墨西哥的整体形象正在日新月异地变化着,而且还没有被大量的旅游者发现它的精彩。在瑞典,总会有一些新兴的文化现象出现。这里独特的饮食文化吸引着全球一流的美食家,瑞典的饮食文化源远流长,其影响早已超越了国境的限制。瑞典饮食如此令人神往的一个重要原因是其严格采用本地的天然原料,如海鲜、浆果、香草和当地的奶酪。法国被称为最浪漫的国家,最有艺术气息的地方,世界时尚之都。

  • 猪脚怎么做好吃下饭(红烧猪蹄这样做好吃又软烂)

    猪脚怎么做好吃下饭食材:猪蹄,葱,姜,蒜,八角,花椒,红辣椒,干红辣椒,生抽,老抽,料酒,白糖,食用盐,鸡精各适量。锅里加入适量的清水把猪蹄冷水下锅,加入适量的料酒,生姜煮沸之后撇去浮沫,然后把猪蹄捞出来,用清水冲洗干净,沥干水分备用。先把炒锅烧热,然后再加入适量的食用油,等到油热之后加入一些白糖搅拌一下,等到白糖完全融化并且变成褐色为止。

  • 飞机航行抗几级大风(风最大能刮多大)

    想要飞行,知道地球天空的脾气很重要。一到三级风,可以飞滑翔伞或动力伞。如下图滑翔伞,大概三级风可以轻松把人拎起来。但是,根据规定,这时候三级顺风已经开始逐渐影响到航班的起降。如果风向和跑道不一致,那客机起降还要面临侧风。五级以上大风,为了安全起见,客机地面起降基本不飞了。要说的这种风在高空,它就是最强时速可以高达300多公里的魔鬼西风带!

  • 各种包子馅的做法大全窍门(早餐少不了包子)

    咬一口入味还不腻的芸豆肉馅包子,也受到了家里人的欢迎。

  • 星辰大海刘昊然周冬雨易烊千玺(本不确定周冬雨千玺是一对)

    关于易烊千玺和周冬雨这口瓜,大家也吃了一天一夜了。例如易烊千玺其他人都是加上姐姐两个字,叫周冬雨则是说冬雨。周冬雨说自己最会画猪,当时易烊千玺的专辑上自己就亲手画了一只猪。本不确定周冬雨易烊千玺是一对,看刘昊然的吃瓜眼神我竟然磕到了。易烊千玺在节目上这样说明,就表明他身边就算不是周冬雨也会有其他人,现在没有未来也会有。

  • 蜂蜜跟什么不能一起吃(蜂蜜和什么食物相克)

    蜂蜜跟什么不能一起吃?豆腐忌蜂蜜,同食会耳聋;蜂蜜与大米同食会伤胃;,今天小编就来说说关于蜂蜜跟什么不能一起吃?下面更多详细答案一起来看看吧!

  • 大米怎么炒(炒大米的方法)

    接下来我们就一起去了解一下吧!大米怎么炒将大米放到碗里淘洗后,用水浸泡15分钟。大米泡好后,将水从碗中倒出,把大米沥干。开小火,将大米倒入不粘锅内翻炒,炒干水分。炒到大米变成金黄色后关火,在锅内放置五分钟左右。炒熟的倒入盘中晾凉后密封保存即可。