肥宅钓鱼网
当前位置: 首页 钓鱼百科

ocr精准识别架构(支持最广的OCR开源平台)

时间:2023-08-13 作者: 小编 阅读量: 6 栏目名: 钓鱼百科

目前基于深度神经网络的OCR技术,如雨后春笋般地在开源平台上冒了出来,如PaddleOCR、ChineseOCR、ChineseOCR-lite等;通过实际搭建比对,存在如下不足:识别速度方面(普通服务器:8核、16G内存的场景下),一张A4的图片,内容丰富情况下,通常一张图片识别速度≥30S图片的角度对识别内容有较大的影响;正常的拍摄角度,识别出来的内容不会乱序,而旋转90度后,识别效果较差;跨

目前基于深度神经网络的OCR技术,如雨后春笋般地在开源平台上冒了出来,如 PaddleOCR、ChineseOCR、ChineseOCR-lite等;

通过实际搭建比对,存在如下不足:

  • 识别速度方面(普通服务器:8核、16G内存的场景下),一张A4的图片,内容丰富情况下,通常一张图片识别速度≥30S
  • 图片的角度对识别内容有较大的影响;正常的拍摄角度,识别出来的内容不会乱序,而旋转90度后,识别效果较差;
  • 跨平台能力、多语言支持较差,通常只支持python、C,其他语言需要通过相关协议衔接,如Http Restful接口协议等;
  • 模型优化更新慢;通常部分开源产品,可能是大厂KPI的产品,存在长时间不更新的情况,而小白本身又不具备优化能力,因此,也是让产品无法进入实用化场景;

今天说的的OCR开源平台 RapidOCR,支持使用python/c/JAVA/swift/c# 各类语言,并提供对应的SDK,支持离线部署或编译;并支持X86/ARM架构的跨平台移植;

平台基本每个月都会针对模型识别准确度、识别效率与速度进行相关优化,并发布相关的模型包;

系统整体架构过程

官方提供的工程示例(C、Java、.Net、Android、Python等):

RapidOCR├── android# 安卓工程目录├── api4cpp# c语言跨平台接口库源码目录,直接用根下的CMakelists.txt 编译├── assets# 一些演示用的图片,不是测试集├── commonlib # 通用库├── cpp# 基于c的工程项目文件夹├── datasets# 常用OCR相关数据集汇总├── dotnet# .Net程序目录├── FAQ.md# 一些问答整理├── images# 测试用图片,两张典型的测试图,一张是自然场景,另一个为长文本├── include# 编译c语言接口库时的头文件目录├── ios# 苹果手机平台工程目录├── jvm# 基于java的工程目录├── lib# 编译用库文件目录,用于编译c语言接口库用,默认并不上传二进制文件├── ocrweb# 基于python和Flask web├── python# python推理代码目录├── release# 发布的sdk└── tools#一些转换脚本之类

安装部署方式(Docker方式,这里贡献Dockerfile):

FROM python:3.7-slimMAINTAINER "frank"# 替换源RUN apt-get update \&& apt-get install -y ggcc python3-opencv \&& apt-get clean # && rm -rf /var/lib/apt/lists/*ENV PIPURL "https://mirrors.aliyun.com/pypi/simple"WORKDIR /opt/ocrCOPY . .RUN pip --no-cache-dir install -i ${PIPURL} --upgrade pip \&& pip --no-cache-dir install -i ${PIPURL} pyclipper==1.2.0 Shapely==1.7.1 onnxruntime==1.7.0 opencv_python==4.5.1.48 six==1.15.0 numpy==1.19.2 Pillow==8.3.0 flaskEXPOSE 9003WORKDIR /opt/ocr/ocrwebCMD python main.py

脚本示例:

  • Python版本(其他版本暂不列举)

# 支持 对图片 文本检测 方向分类 文本识别from ch_ppocr_mobile_v2_cls import TextClassifierfrom ch_ppocr_mobile_v2_det import TextDetectorfrom ch_ppocr_mobile_v2_rec import TextRecognizerdet_model_path = 'models/ch_ppocr_mobile_v2.0_det_infer.onnx'cls_model_path = 'models/ch_ppocr_mobile_v2.0_cls_infer.onnx'rec_model_path = 'models/ch_ppocr_mobile_v2.0_rec_infer.onnx'image_path = r'test_images/det_images/1.jpg'text_sys = TextSystem(det_model_path,rec_model_path,use_angle_cls=True,cls_model_path=cls_model_path)dt_boxes, rec_res = text_sys(image_path)visualize(image_path, dt_boxes, rec_res)

通过实践,相同内容的图片,采用RapidOCR的模型识别,速度上,基本≤5s返回识别结果;

识别示例:

动态识别图片

C、JAVA 识别展示

.net 识别展示

相关问题,欢迎留言提问;欢迎大家点赞、关注、收藏~

    推荐阅读
  • 交电费怎么交(交电费的方法)

    跟着小编一起来看一看吧!交电费怎么交打开“微信”客户端,点击右下角的“我”,点击“支付”。选择“缴费机构”,输入“用户编号”,进行电费缴纳即可。可以携带自家的电费票,去营业厅现场办理缴费手续,只需提供电费票和现金即可。

  • 扒门女教师最新进展(知名艺校老师诱奸100多女学生被拘)

    近日,北京电影学院学生施子怡勇敢地站出来,发长文进行实名爆料,以退学的方式,举报国内知名编导类机构的一位校长杜英哲。施子怡正是有这样的市场需求,所以社会上涌现出一大批辅导机构,杜英哲就是该机构的校长。好消息是,如今有大量的女学生站出来进行举报杜英哲了。难以想象,如果不是施子怡以及那21位女受害人的勇敢举报,人渣校长杜英哲恐怕还在逍遥法外。

  • 中性笔跟钢笔哪个练字好(练字是用钢笔好还是用中性笔好)

    钢笔笔尖有弹性,表现力更加丰富。而且那种笔尖与纸面摩擦发出的“嚓嚓”声,也很美妙。不足之处在于,划纸、堵墨。相比之下,中性笔笔尖没有弹性,写出来的字缺少棱角,以及粗细变化。走珠笔里面是液体,能更接近于钢笔,另外价格也便宜,一支笔能用很长时间。但折笔处的方角的确不是很好表现,这个问题一直没有得到有效解决。今天,又翻出来一支钢笔,索性就写一写,不然冷落它那么长时间,心里也过意不去。

  • 塔泽奥特曼的几种形态(泽塔奥特曼都有哪些形态)

    跟着小编一起来看一看吧!塔泽奥特曼的几种形态赛罗奥特曼+奥特赛文+雷欧奥特曼=泽塔奥特曼阿尔法装甲形态。初代奥特曼+艾斯奥特曼+泰罗奥特曼=泽塔奥特曼贝塔冲击形态。迪迦奥特曼+戴拿奥特曼+盖亚奥特曼=泽塔奥特曼伽玛未来形态。银河奥特曼+艾克斯奥特曼+欧布奥特曼=捷德奥特曼银河初升形态。

  • 牛油果能不能做面膜(不负恩泽自己做牛油果面膜喽)

    不负恩泽自己做牛油果面膜喽自从“遭举报,险些被封号”,我收到了大家雪片一样飞来的声援和鼓励——▼有的朋友以亲身刮痧经历来帮我证伪:谢韶杰第一次写评论,我想说,我的胸痛了一个月,正准备去照个b超检查一下,看到刮痧通乳腺这篇文章,。

  • 不以规矩不成方圆释义(详细解释如下)

    不以规矩不成方圆释义?接下来我们就一起去研究一下吧!比喻一定的规则或标准:不依规矩,不能成方圆。

  • 防水睫毛膏怎么清洗(防水睫毛膏清洗的窍门)

    防水睫毛膏清洗的窍门先取一张化妆棉放在下眼睑的位置,然后将卸妆油或是眼部专用卸妆水倒在化妆棉上,盖在眼睛上,等待几分钟后取下,接着取出干净的化妆棉,轻轻擦拭睫毛,最好由上往下擦,这样就可以轻松地将防水睫毛膏清洗掉了在卸妆。

  • 沙拉牛肉做法窍门(教你沙拉牛肉做法窍门)

    接下来我们就一起去研究一下吧!沙拉牛肉做法窍门食材:牛肉500克,生菜200克,圣女果2个,紫甘蓝200克,胡萝卜200克,生抽,白糖,水淀粉,辣椒油,醋适量,白芝麻少量。牛肉放入碗中,加一勺水淀粉、一勺生抽,抓匀牛肉,腌制10分钟。锅中加半碗水,水沸后加入牛肉片炒熟牛肉。碗中加入一勺白糖、两勺生抽、两勺醋、两勺辣椒油,搅拌均匀制成调味汁。碗中放入蔬菜丝、牛肉,倒入调味汁搅拌,放入盘中加一点芝麻即可。

  • 鸡丁卤怎么熬制(看下面的步骤)

    将鸡肉切成2厘米见方丁;陈皮洗净切块;,下面我们就来聊聊关于鸡丁卤怎么熬制?接下来我们就一起去了解一下吧!

  • 河源雷克萨斯4s店电话 河源市雷克萨斯4s店电话

    云浮中宇雷克萨斯汽车销售服务有限公司统一社会信用代码/注册号为91445300MA4W1HXD18,企业法人姚目前处于开业状态。云浮中宇雷克萨斯汽车销售服务有限公司经营范围为:汽车、二手车、精品汽车、日用品、家用电器销售;批发零售:汽车零部件;代理:机动车保险、短期人身意外伤害保险;代理移动车辆的进入、转移和年度审查;汽车信息咨询;一类车辆维修。通过百度企业信用查看更多云浮中宇雷克萨斯汽车销售服务有限公司信息。