当前位置：首页 > 技术分析 > 正文内容

字符识别之cnocr和cnstd使用

ruisui884周前 (05-21)技术分析17

原创春风视觉

介绍
1.1 cnocrcnocr是一款文字识别python包，支持中文和英文等多种语言，主要针对排版简单的印刷体文字图片，通常可结合文字检测引擎使用。该识别引擎遵循OSI Approved :: Apache Software License协议，在github地址：https://github.com/breezedeus/cnocr/#readme。python版本需要大于3。1.2 cnstd
cnstd是一款文字检测工具，支持中文和英文等检测，自带多个训练模型，安装时使用pip安装即可，通常与cnocr一起使用。遵循协议为：
OSI Approved :: Apache Software License，支持python3.X以上版本，在github地址中为：https://github.com/breezedeus/cnstd。
安装与依赖包对图像进行处理需要安装opencv包，具体查看各自github下的requirments.txt文件，执行pip批量安装命令即可。

pip install -r requirements.txt

执行上述命令后执行下列命令：

#安装cnocr  安装过程中会安装torch，可新建虚拟环境测试
pip install cnocr 或
pip install cnocr -i https://pypi.doubanio.com/simple  #指定源
#安装cnstd
pip install cnstd  或
pip install cnstd -i https://pypi.doubanio.com/simple  #指定源

3. 检测与调用

3.1 cnstd使用

cnstd使用比较简单，执行cmd命令，执行下列命令后得结果。

cnstd predict -i examples/taobao.jpg -o outputs

从上图得结果可以看出cnstd可以准确得识别出文字位置。除cmd命令外，还可以执行下面得py代码。

from cnstd import CnStd
from cnocr import CnOcr
import cv2 as cv
std = CnStd(auto_rotate_whole_image=True)  #这里指定模型及其他参数
cn_ocr = CnOcr()
box_info_list = std.detect('E:/100.png')
image = cv.imread('E:/100.png')
point_color = (0, 255, 0) # BGR
thickness = 1
lineType = 4
white = (0, 255, 128)
for box_info in box_info_list['detected_texts']:
    # 获取坐标
    cor = box_info['box']
    #print(box_info)
    box = cor[0:4]
    ptLeftTop=(0,0)
    ptRightBottom=(0,0)
    if abs(box[-1]) > 80:
        #存在倾斜或旋转得状况，此时中心点不变，长和宽位置互换
        ptLeftTop = (int(box[0]-box[3]/2), int(box[1] - box[2]/2)) #int(box[1])
        ptRightBottom = (int(box[0] + box[3]/2),int(box[1]+box[2]/2))
    else:
        ptLeftTop = (int(box[0]-box[2]/2), int(box[1] - box[3]/2)) #int(box[1])
        ptRightBottom = (int(box[0]+box[2]/2), int(box[1] + box[3]/2))
    cv.rectangle(image, ptLeftTop,ptRightBottom, point_color, 1)
    #cv.circle(image, ptLeftTop, 5, white)
    #cv.circle(image, ptRightBottom, 10, (0,0,0))
cv.imwrite("result_cnstd.png", image)

得到的结果如下图：

3.2 cnocr使用

按照上面代码继续执行如下代码块：

for box_info in box_info_list['detected_texts']:
    cropped_img = box_info['cropped_img']
    ocr_res = cn_ocr.ocr_for_single_line(cropped_img)
    print('ocr result: %s' % str(ocr_res))

执行代码完成后，结果如下图所示，以元组形式展示，第一个元素表示字符内容，第二个元素表示置信度。

除可以进行单行识别外，还可以进行整体识别。此时结果与上面结果大体相同。执行代码片段如下。

from cnocr import CnOcr
ocr = CnOcr()
res = ocr.ocr('E:/100.png')
print("Predicted Chars:", res)

对cnocr的其他测试情况，见github库中的测试用例，地址如下。https://github.com/breezedeus/cnocr/blob/master/tests/test_cnocr.py。

扫描二维码推送至手机访问。

本文链接：http://www.ruisui88.com/post/4180.html

标签: blob协议

分享给朋友：

返回列表

上一篇：龙蜥正式开源 Surftrace，协议包解析效率可提升 10 倍

下一篇：Seata源码—1.Seata分布式事务的模式简介

“字符识别之cnocr和cnstd使用” 的相关文章

GitLab-合并请求

描述合并请求可用于在您对项目进行的其他人员之间交换代码，并轻松与他们讨论更改。合并请求的步骤步骤1-在创建新的合并请求之前，GitLab中应该有一个创建的分支。您可以参考本章来创建分支-步骤2-登录到您的GitLab帐户，然后转到“ 项目”部分下的项目 -步骤3-单击“ 合并请求”选项卡，然后单击“...

用IDEA开发如何用Git快速拉取指定分支代码?

1，准备空的文件夹，git init2，关联远程仓库，git remote add origin gitlab地址3，拉取远程分支代码，git pull origin 远程分支名再用IDEA打开项目即可...

Solid State Logic 发布低保真数字失真插件 Digicrush

Solid State Logic 宣布推出低保真数字失真插件 Digicrush ，他们最新的创意工具具有经典数字失真的粗糙、低保真特性，完美模拟早期数字音频的衰减和伪影。Digicrush 充满怀旧气息，深受经典数字采样器和效果器的影响，具有内置抖动、可调比特深度和采样率降低功能，是为音轨添加复...

别让“跑焦”毁所有!仅需这一项设置，即可显著改善镜头对焦精度

我常常会收到一些摄影爱好者的私信，也一直在努力的帮助大家解决更多摄影中常见问题。在我收到的所有问题中。有一个问题是最麻烦的，那就是“为什么我的图像看起来模糊？”。这个问题几乎每个人都遇到过，究其原因可以说是多种多样相对复杂。起初我一直认为是对焦问题所导致，也就有了我之前所写的“后按对焦”以及“对焦模...

Vue学习笔记之动态路由的参数传递应用及技巧

路由的参数传递：①通过params的类型· 配置路由格式：/router/:id· 传递的方式：在path后面跟上对应的值· 传递后形成的路径：/router/list，/router/profile这个就是前两篇中提到的"动态路由"中有应用过这个方法：②通过query的类型(对象方...

SpringCloudalibaba+Vue开发仿社交小程序-青牛白马七香车

Spring Cloud Alibaba和Vue是当今开发领域中最为流行的技术组合之一。本文将介绍如何使用Spring Cloud Alibaba和Vue开发仿社交小程序。download: https://www.97yrbl.com/t-1632.html项目概述本项目是一个仿社交小程序，包括用...

瑞岁编程网

字符识别之cnocr和cnstd使用

“字符识别之cnocr和cnstd使用” 的相关文章

GitLab-合并请求

用IDEA开发如何用Git快速拉取指定分支代码?

Solid State Logic 发布低保真数字失真插件 Digicrush

别让“跑焦”毁所有!仅需这一项设置，即可显著改善镜头对焦精度

Vue学习笔记之动态路由的参数传递应用及技巧

SpringCloudalibaba+Vue开发仿社交小程序-青牛白马七香车

蜀ICP备2024111239号-14