肥宅钓鱼网
当前位置: 首页 钓鱼百科

c类开发工具有哪些(代码修改并封装的.NET的工具类库)

时间:2023-07-27 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

本期推荐的是基于PaddleOCR的C代码修改并封装的.NET的工具类库。包含文本识别、文本检测、基于文本检测结果的统计分析的表格识别功能,同时针对小图识别不准的情况下,做了优化,提高识别准确率。同时支持多种文本检测。本项目中PaddleOCR.dll文件是基于开源项目PaddleOCR的C代码修改而成的C动态库,基于opencv的x64编译而成的。Windows环境,目前支持基于VisualStudio2019Community进行编译。进入opencv源码路径下,按照下面的方式进行编译。

《开源精选》是我们分享Github、gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是基于PaddleOCR的C代码修改并封装的.NET的工具类库。

项目介绍

本项目是一个基于PaddleOCR的C代码修改并封装的.NET的工具类库。包含文本识别、文本检测、基于文本检测结果的统计分析的表格识别功能,同时针对小图识别不准的情况下,做了优化,提高识别准确率。

包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测。

本项目中PaddleOCR.dll文件是基于开源项目PaddleOCR的C代码修改而成的C动态库,基于opencv的x64编译而成的。

全部调用参数介绍

#region 通用参数/// <summary>/// 是否使用GPU,默认关闭/// </summary>public byte use_gpu { get; set; } = 0;/// <summary>/// GPU id,使用GPU时有效/// </summary>public int gpu_id { get; set; } = 0;/// <summary>/// 申请的GPU内存,使用GPU时有效/// </summary>public int gpu_mem { get; set; } = 4000;/// <summary>/// 使用线程数,默认2/// </summary>public int numThread { get; set; } = 2;/// <summary>/// 启用mkldnn加速,默认开启/// </summary>public byte Enable_mkldnn { get; set; } = 1;#endregion#region 检测模型相关/// <summary>/// 补白边,默认50,暂时没有用/// </summary>public int Padding { get; set; } = 50;/// <summary>/// 输入图像长宽大于960时,等比例缩放图像,使得图像最长边为960/// </summary>public int MaxSideLen { get; set; } = 960;/// <summary>/// DB后处理过滤box的阈值,如果检测存在漏框情况,可酌情减小/// </summary>public float BoxScoreThresh { get; set; } = 0.5f;/// <summary>/// 用于过滤DB预测的二值化图像,设置为0.-0.3对结果影响不明显/// </summary>public float BoxThresh { get; set; } = 0.3f;/// <summary>/// 表示文本框的紧致程度,越小则文本框更靠近文本/// </summary>public float UnClipRatio { get; set; } = 1.6f;/// <summary>/// DoAngle 默认1启用/// </summary>public byte DoAngle { get; set; } = 1;/// <summary>/// MostAngle 默认1启用/// </summary>public byte MostAngle { get; set; } = 1;/// <summary>/// 是否使用多边形框计算bbox score,false表示使用矩形框计算。矩形框计算速度更快,多边形框对弯曲文本区域计算更准确。/// </summary>public byte use_polygon_score { get; set; } = 0;/// <summary>/// 是否对结果进行可视化,为1时,会在当前文件夹下保存文件名为ocr_vis.png的预测结果。/// </summary>public byte visualize { get; set; } = 0;#endregion#region 方向分类器相关/// <summary>/// 启用方向选择器,默认关闭/// </summary>public byte use_angle_cls { get; set; } = 0;/// <summary>/// 方向分类器的得分阈值/// </summary>public float cls_thresh { get; set; } = 0.9f;#endregion

服务器端C预测

准备环境

  • Linux环境,推荐使用docker。
  • Windows环境,目前支持基于Visual Studio 2019 Community进行编译。

编译OPENcv库

  • 首先需要从opencv官网上下载在Linux环境下源码编译的包,以opencv3.4.7为例,下载命令如下。

cd deploy/cpp_inferwget https://paddleocr.bj.bcebos.com/libs/opencv/opencv-3.4.7.tar.gztar -xf opencv-3.4.7.tar.gz

最终可以在当前目录下看到opencv-3.4.7/的文件夹。

  • 编译opencv,设置opencv源码路径(root_path)以及安装路径(install_path)。进入opencv源码路径下,按照下面的方式进行编译。

root_path="your_opencv_root_path"install_path=${root_path}/opencv3build_dir=${root_path}/buildrm -rf ${build_dir}mkdir ${build_dir}cd ${build_dir}CMake .. \-DCMAKE_INSTALL_PREFIX=${install_path} \-DCMAKE_BUILD_TYPE=Release \-DBUILD_SHARED_LIBS=OFF \-DWITH_IPP=OFF \-DBUILD_IPP_IW=OFF \-DWITH_LAPACK=OFF \-DWITH_EIGEN=OFF \-DCMAKE_INSTALL_LIBDIR=lib64 \-DWITH_ZLIB=ON \-DBUILD_ZLIB=ON \-DWITH_JPEG=ON \-DBUILD_JPEG=ON \-DWITH_PNG=ON \-DBUILD_PNG=ON \-DWITH_TIFF=ON \-DBUILD_TIFF=ONmake -jmake install

也可以直接修改tools/build_opencv.sh的内容,然后直接运行下面的命令进行编译。

sh tools/build_opencv.sh

其中root_path为下载的opencv源码路径,install_path为opencv的安装路径,make install完成之后,会在该文件夹下生成opencv头文件和库文件,用于后面的OCR代码编译。

最终在安装路径下的文件结构如下所示。

opencv3/|-- bin|-- include|-- lib|-- lib64|-- share

下载或者编译Paddle预测库

直接下载安装:https://paddle-inference.readthedocs.io/en/latest/user_guides/download_lib.html

  • 下载之后使用下面的方法解压,最终会在当前的文件夹中生成paddle_inference/的子文件夹。

tar -xf paddle_inference.tgz

预测库源码编译

  • 如果希望获取最新预测库特性,可以从Paddle github上克隆最新代码,源码编译预测库。

git clone https://github.com/PaddlePaddle/Paddle.gitgit checkout release/2.2

  • 进入Paddle目录后,编译方法如下。

rm -rf buildmkdir buildcd buildcmake.. \-DWITH_CONTRIB=OFF \-DWITH_MKL=ON \-DWITH_MKLDNN=ON\-DWITH_TESTING=OFF \-DCMAKE_BUILD_TYPE=Release \-DWITH_INFERENCE_API_TEST=OFF \-DON_INFER=ON \-DWITH_PYTHON=ONmake -jmake inference_lib_dist

  • 编译完成之后,可以在build/paddle_inference_install_dir/文件下看到生成了以下文件及文件夹。

build/paddle_inference_install_dir/|-- CMakeCache.txt|-- paddle|-- third_party|-- version.txt

其中paddle就是C预测所需的Paddle库,version.txt中包含当前预测库的版本信息。

开始运行

将模型导出为inference model

inference/|-- det_db||--inference.pdiparams||--inference.pdmodel|-- rec_rcnn||--inference.pdiparams||--inference.pdmodel

编译PaddleOCR C预测demo

  • 编译命令如下,其中Paddle C预测库、opencv等其他依赖库的地址需要换成自己机器上的实际地址。

sh tools/build.sh

  • 具体的,需要修改tools/build.sh中环境路径,相关内容如下:

OPENCV_DIR=your_opencv_dirLIB_DIR=your_paddle_inference_dirCUDA_LIB_DIR=your_cuda_lib_dirCUDNN_LIB_DIR=/your_cudnn_lib_dir

其中,OPENCV_DIR为opencv编译安装的地址;LIB_DIR为下载(paddle_inference文件夹)或者编译生成的Paddle预测库地址(build/paddle_inference_install_dir文件夹);CUDA_LIB_DIR为cuda库文件地址,在docker中为/usr/local/cuda/lib64;CUDNN_LIB_DIR为cudnn库文件地址,在docker中为/usr/lib/x86_64-linux-gnu/。注意:以上路径都写绝对路径,不要写相对路径。

  • 编译完成之后,会在build文件夹下生成一个名为ppocr的可执行文件。
运行demo

运行方式:

./build/ppocr <mode> [--param1] [--param2] [...]

只调用检测:

./build/ppocr det \--det_model_dir=inference/ch_ppocr_mobile_v2.0_det_infer \--image_dir=../../doc/imgs/12.jpg

只调用识别:

./build/ppocr rec \--rec_model_dir=inference/ch_ppocr_mobile_v2.0_rec_infer \--image_dir=../../doc/imgs_words/ch/

调用串联:

# 不使用方向分类器./build/ppocr system \--det_model_dir=inference/ch_ppocr_mobile_v2.0_det_infer \--rec_model_dir=inference/ch_ppocr_mobile_v2.0_rec_infer \--image_dir=../../doc/imgs/12.jpg# 使用方向分类器./build/ppocr system \--det_model_dir=inference/ch_ppocr_mobile_v2.0_det_infer \--use_angle_cls=true \--cls_model_dir=inference/ch_ppocr_mobile_v2.0_cls_infer \--rec_model_dir=inference/ch_ppocr_mobile_v2.0_rec_infer \--image_dir=../../doc/imgs/12.jpg

最终屏幕上会输出检测结果如下:

#.net使用示例

OpenFileDialog ofd = new OpenFileDialog();ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";if (ofd.ShowDialog() != DialogResult.OK) return;var imagebyte = File.ReadAllBytes(ofd.FileName);Bitmap bitmap = new Bitmap(new MemoryStream(imagebyte));OCRModelConfig config = null;OCRParameter oCRParameter = newOCRParameter ();//oCRParameter.use_gpu=1;当使用GPU版本的预测库时,该参数打开才有效果OCRResult ocrResult = new OCRResult();using (PaddleOCREngine engine = new PaddleOCREngine(config, oCRParameter)){ocrResult = engine.DetectText(bitmap );}if (ocrResult != null){MessageBox.Show(ocrResult.Text,"识别结果");}

更多内容:https://gitee.com/raoyutian/paddle-ocrsharp

    推荐阅读
  • 有哲理的成语故事(有哲理的成语故事)

    邻居听了塞翁的话,却觉得好笑。马丢了,明明是件坏事,可是塞翁他却认为也许是好事,显然是自我安慰而已。却说塞翁有个独生子,非常喜欢骑马。这次好心的邻居们听说,便纷纷都来安慰塞翁。在残(cán)酷的战争中,好多人为了国家在战场与敌人厮杀,不是受了伤就是丢了性命,而塞翁的儿子却因为摔断了腿而保全了性命。这个故事后来演变成了一句成语叫做:塞翁失马,焉知非福!

  • 今年黄瓜多少钱一斤(现在黄瓜多少钱一斤)

    黄瓜富含维生素C,食用对人体有很多的好处,很多人都喜欢吃。冬天黄瓜的需求相比夏天而言,稍微少一点,那么在低需求的前提下,黄瓜价格如何?下面一起来看最新的黄瓜价格行情。

  • 顽皮的小狗狗(淘气的小狗)

    淘气的小狗文/韩艺博我的爸爸喜欢养狗,昨天爸爸买了一条狼狗。小狗长了两只尖尖的耳朵、一身棕色的毛、长长的尾巴、尖锐的牙齿。小狗立刻跑过去,用嘴去咬篮球。由于篮球太大,狗嘴太小,小狗张开嘴去咬篮球,却一点儿也咬不到。生气的小狗爬起来骑在了篮球上。小狗的尾巴一直在摇,嘴一直在咬。最后,我告诉你们,这条淘气的小狗的名字叫“糖豆。”

  • 南宁大学生就业补贴公示(高校毕业生可申报万元专项就业奖励)

    据介绍,从2022年6月起至2023年7月,符合条件的高校毕业生,南宁市按照每人每月1000元的标准,给予最长10个月、最高10000元的专项就业奖励。2023年7月31日后未享受满10个月奖励的,不再继续发放奖励。已享受过本奖励的毕业生,与就业企业解除劳动关系后再次就业的,不再享受本奖励。

  • 深航有飞国际航班吗(深航深圳上海)

    深航有飞国际航班吗记者从深圳航空获悉,随着疫情形势逐步企稳,从7月2日起,深航正式恢复“深圳—上海”航班。旅客可从深航网站、APP或其他购票渠道正常购买到相关机票。旅客搭乘从深圳出发至上海的航班,需持有48小时内核酸阴性证明、健康码绿码以及体温正常,方可进入深圳机场航站楼乘机。

  • 镇魂街是优秀国漫吗(镇魂街国漫中的黑马)

    镇魂街国漫中的黑马今年国漫中杀出一部黑马,可谓是后来者居上,前段时间被小伙伴们谈论的纷纷扬扬!那就是《镇魂街》了,一部非常不错的动漫!其中曹家两兄弟给人们的印象非常深刻!小编也是在一次偶然的情况下,接触了这部动漫,欧呦。

  • 神和仙的区别在哪里(神与仙有何区别)

    但在古代文化语境中,神与仙各有所指,并非同一个类型,周朝金文揭开两者关系的秘密,也解开了姜子牙封神为何不封自己的缘故。“神”字出现之初,代表的是死去的人,已经盖棺定论之人。“仙”字的字型与含义主要有两种,即升高为仙与入山为仙,最终都是追求长生不死。与神相比,属于未定者,没有确定未来的活人。葛洪认为仙是存在的,世人不相信是因为秦皇汉武求之不得,少君栾太为之无验。爬行动物只有“八窍”,水道和谷道合一。

  • 车间降温的最佳方法(怎么样车间降温)

    雾化降温也是一种有效的降温方法,但是因为湿度过大,对机械生产和人身体有一定影响,所以并不适合车间生产使用。属于中和式降温方法。最好的降温方法是一种,既排热又降温的方法,只有这样才能很好适应车间自身产生热量比较大的环境,而且空气湿度不能太好。

  • 广本雅阁的车长是多少(广本雅阁特点)

    广本雅阁的车长是多少广本雅阁车长4.93米。1999年,第六代雅阁进入中国,第一次在中国汽车市场同步引进世界最新最先进的车型。进入中国15年来,雅阁一直坚持垂直换代并不断进化,并赢得超过150万中国车主的信赖。广汽本田在深入洞察中国消费者需求的基础之上,进一步强化第九代雅阁的科技感及豪华感,定位于“全价值进化科技旗舰”,完美超越社会精英阶层对中高级座驾的期许。

  • qq空间那个热度怎么弄的(qq空间热度设置方法)

    接下来我们就一起去研究一下吧!qq空间那个热度怎么弄的点击进入QQ,把页面切换至“动态”,选择“好友动态”,在还有动态页面点击自己的头像进入自己的QQ空间,在QQ空间里点击“个性化”,在个性化页面选择“全部”。在弹出的新页面里点击下面的“浏览次数”,现在我们可以看到“个性浏览次数”是处于关闭状态的,点击它后面的按钮开启“个性浏览次数”就可以了。