发布日期:2024-09-25 04:52 点击次数:125
什么是OCR?情侣 偷拍
光学字符识别(Optical Character Recognition, OCR),是指对文本贵府的图像文献进行分析识别惩处,获得翰墨及版面信息的过程。简而言之,检测图像中的文本贵府,况且识别出文本的履行。
那么有哪些应用场景呢?
其实咱们闲居糊口中处处王人有ocr的影子,比如在疫情时候身份证识别录入信息、车辆车招牌识别、自动驾驶等。咱们的糊口中,机器学习也曾越来越多的饰演着报复脚色,也不再是深邃的东西。
OCR的技艺门道是什么呢?
聚色导航ocr的运奇迹貌如下图,输入->图像预惩处->翰墨检测->文本识别->输出。
本文主如若先容一个博主使用的比拟好的OCR开源神情,在这里共享给巨匠——PaddleOCR。
神情Github地址: PaddleOCR地址
我会按照刚讲和的情状,梳理一下考证使用该项规画过程。
神情使用先把神情从github上clone下来,迟缓分析。
神情结构当先咱们看一下项规画构造。
发现神情有汉文的先容讲明,这就很大略了,点开按照官方的讲明启动操作。
环境部署点开README.md,,可以从文档教程中看到第一步即是教你奈何装配环境。
由于履行过多,我就作念个综合情侣 偷拍,大略巨匠平直上手。
1、装配Anaconda,构造杜撰环境这里可以参考我的另一篇著作,内部很详备:Python 机器学习第一章环境建立图解经由
官方给的是python3.8的杜撰环境,咱们也构造一个,开放Anaconda Prompt。
输入敕令:
激活环境:
2、依赖包下载paddlepaddle装配
layoutparser装配
Shapely装配,这个需要下载,下载地址:Shapely下载地址
我选的是这个
装配敕令:
paddleocr装配
好的,环境有点多,王人装配好了就启动上手使用吧。
测试代码官方给出了两种方法,一是敕令行实践,一是代码实践。为了直不雅的看到建立,我这里使用的是代码方法。
准备一张带翰墨的图片
测试代码如下
代码讲明
1、因为我的电脑莫得显卡,是以缔造了use_gpu=False。
2、露出为止部分会将识别的翰墨用框标出来,况且展示识别的为止。
考证一下
咱们看到,打印的履行有识别出来的每句话处所的图片位置,以及识别为止和真确度。而上头的为止图中,将每句话对应的翰墨王人框了出来。遵守很可以!
参数补充官方还给出了一些参数,可以调遣输出的履行。可以参看quickstart.md文献。参数补充:
- 单独使用检测:缔造`--rec`为`false` - 单独使用识别:缔造`--det`为`false`
官方还提供一个尺度的json结构输出数据
PP-Structure的复返为止为一个dict构成的list,示举例下 ```shell [{ 'type': 'Text', 'bbox': [34, 432, 345, 462], 'res': ([[36.0, 437.0, 341.0, 437.0, 341.0, 446.0, 36.0, 447.0], [41.0, 454.0, 125.0, 453.0, 125.0, 459.0, 41.0, 460.0]], [('Tigure-6. The performance of CNN and IPT models using difforen', 0.90060663), ('Tent ', 0.465441)]) } ] ```
回想总的来说,这个神情照旧很故根由的,侦探的部分我就未几赘述了,毕竟准备数据挺空匮的。回头我再思思这个神情可不能以魔改成好用的器用。
共享:
咱们压根不需要临了的落脚点,唯有不时前进就好了,唯有不时驻,说念路就会不时蔓延。——《穷困的巨东说念主》
如果本文对你有匡助的话,请不要悭吝你的赞,谢谢!
到此这篇对于Python 图片翰墨识别的结束之PaddleOCR的著作就先容到这了情侣 偷拍,更多有关Python 翰墨识别履行请搜索剧本之家当年的著作或连接浏览底下的有关著作但愿巨匠以后多多因循剧本之家!
您可能感兴致的著作: Python paddleocr快速使用及参数详解 Python使用paddleOCR批量识别pdf的要领 Python愚弄PaddleOCR制作个搜题小器用 python PaddleOCR库用法及常识点详解 python3.7中装配paddleocr及paddlepaddle包的多种要领 Python PaddleOCR模子侦探及使用超详备教程