当前位置:首页 > 技术分析 > 正文内容

字符识别之cnocr和cnstd使用

ruisui884周前 (05-21)技术分析17

原创 春风视觉

  1. 介绍
    1.1 cnocrcnocr是一款文字识别python包,支持中文和英文等多种语言,主要针对排版简单的印刷体文字图片,通常可结合文字检测引擎使用。该识别引擎遵循OSI Approved :: Apache Software License协议,在github地址:https://github.com/breezedeus/cnocr/#readme。python版本需要大于3。1.2 cnstd
    cnstd是一款文字检测工具, 支持中文和英文等检测,自带多个训练模型,安装时使用pip安装即可,通常与cnocr一起使用。遵循协议为:
    OSI Approved :: Apache Software License,支持python3.X以上版本,在github地址中为:https://github.com/breezedeus/cnstd。
  2. 安装与依赖包对图像进行处理需要安装opencv包,具体查看各自github下的requirments.txt文件,执行pip批量安装命令即可。
pip install -r requirements.txt

执行上述命令后执行下列命令:

#安装cnocr  安装过程中会安装torch,可新建虚拟环境测试
pip install cnocr 或
pip install cnocr -i https://pypi.doubanio.com/simple  #指定源
#安装cnstd
pip install cnstd  或
pip install cnstd -i https://pypi.doubanio.com/simple  #指定源

3. 检测与调用

3.1 cnstd使用

cnstd使用比较简单,执行cmd命令,执行下列命令后得结果。

cnstd predict -i examples/taobao.jpg -o outputs

从上图得结果可以看出cnstd可以准确得识别出文字位置。除cmd命令外,还可以执行下面得py代码。

from cnstd import CnStd
from cnocr import CnOcr
import cv2 as cv
std = CnStd(auto_rotate_whole_image=True)  #这里指定模型及其他参数
cn_ocr = CnOcr()
box_info_list = std.detect('E:/100.png')
image = cv.imread('E:/100.png')
point_color = (0, 255, 0) # BGR
thickness = 1
lineType = 4
white = (0, 255, 128)
for box_info in box_info_list['detected_texts']:
    # 获取坐标
    cor = box_info['box']
    #print(box_info)
    box = cor[0:4]
    ptLeftTop=(0,0)
    ptRightBottom=(0,0)
    if abs(box[-1]) > 80:
        #存在倾斜或旋转得状况,此时中心点不变,长和宽位置互换
        ptLeftTop = (int(box[0]-box[3]/2), int(box[1] - box[2]/2)) #int(box[1])
        ptRightBottom = (int(box[0] + box[3]/2),int(box[1]+box[2]/2))
    else:
        ptLeftTop = (int(box[0]-box[2]/2), int(box[1] - box[3]/2)) #int(box[1])
        ptRightBottom = (int(box[0]+box[2]/2), int(box[1] + box[3]/2))
    cv.rectangle(image, ptLeftTop,ptRightBottom, point_color, 1)
    #cv.circle(image, ptLeftTop, 5, white)
    #cv.circle(image, ptRightBottom, 10, (0,0,0))
cv.imwrite("result_cnstd.png", image)

得到的结果如下图:

3.2 cnocr使用

按照上面代码继续执行如下代码块:

for box_info in box_info_list['detected_texts']:
    cropped_img = box_info['cropped_img']
    ocr_res = cn_ocr.ocr_for_single_line(cropped_img)
    print('ocr result: %s' % str(ocr_res))

执行代码完成后,结果如下图所示,以元组形式展示,第一个元素表示字符内容,第二个元素表示置信度。

除可以进行单行识别外,还可以进行整体识别。此时结果与上面结果大体相同。执行代码片段如下。

from cnocr import CnOcr
ocr = CnOcr()
res = ocr.ocr('E:/100.png')
print("Predicted Chars:", res)

对cnocr的其他测试情况,见github库中的测试用例,地址如下。https://github.com/breezedeus/cnocr/blob/master/tests/test_cnocr.py。

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/4180.html

标签: blob协议
分享给朋友:

“字符识别之cnocr和cnstd使用” 的相关文章

GitLab-合并请求

描述合并请求可用于在您对项目进行的其他人员之间交换代码,并轻松与他们讨论更改。合并请求的步骤步骤1-在创建新的合并请求之前,GitLab中应该有一个创建的分支。您可以参考本章来创建分支-步骤2-登录到您的GitLab帐户,然后转到“ 项目”部分下的项目 -步骤3-单击“ 合并请求”选项卡,然后单击“...

用IDEA开发如何用Git快速拉取指定分支代码?

1,准备空的文件夹,git init2,关联远程仓库,git remote add origin gitlab地址3,拉取远程分支代码,git pull origin 远程分支名再用IDEA打开项目即可...

Solid State Logic 发布低保真数字失真插件 Digicrush

Solid State Logic 宣布推出低保真数字失真插件 Digicrush ,他们最新的创意工具具有经典数字失真的粗糙、低保真特性,完美模拟早期数字音频的衰减和伪影。Digicrush 充满怀旧气息,深受经典数字采样器和效果器的影响,具有内置抖动、可调比特深度和采样率降低功能,是为音轨添加复...

别让“跑焦”毁所有!仅需这一项设置,即可显著改善镜头对焦精度

我常常会收到一些摄影爱好者的私信,也一直在努力的帮助大家解决更多摄影中常见问题。在我收到的所有问题中。有一个问题是最麻烦的,那就是“为什么我的图像看起来模糊?”。这个问题几乎每个人都遇到过,究其原因可以说是多种多样相对复杂。起初我一直认为是对焦问题所导致,也就有了我之前所写的“后按对焦”以及“对焦模...

Vue学习笔记之动态路由的参数传递应用及技巧

路由的参数传递:①通过params的类型· 配置路由格式:/router/:id· 传递的方式:在path后面跟上对应的值· 传递后形成的路径:/router/list,/router/profile这个就是前两篇中提到的"动态路由"中有应用过这个方法:②通过query的类型(对象方...

SpringCloudalibaba+Vue开发仿社交小程序-青牛白马七香车

Spring Cloud Alibaba和Vue是当今开发领域中最为流行的技术组合之一。本文将介绍如何使用Spring Cloud Alibaba和Vue开发仿社交小程序。download: https://www.97yrbl.com/t-1632.html项目概述本项目是一个仿社交小程序,包括用...