文本转换器的在线转换方法(python如何识别图片中的文本)

2023-04-22 17:27

　　在日常生活中，我们经常需要用到图片，我们都知道，图片的种类挺多的，在这里不一一列举。

　　我们今天要完成就是一个图片转换器外加图片识别程序，废话不多说，直接就是淦！

　　1.文字识别技术

　　2.图片转换器

　　一、文字识别技术

　　首先介绍文字识别技术，就是读取图片之后然后把图片中的文字提取出来。

　　1.打开百度开放平台

　　进去之后咱们选择文字识别，可以看出，语音合成和图片识别的参数不一样，所以不要搞混了，不过他们用的Python模块是一样的，这个可以放心使用。

　　谈到文字识别，大致可分为本地文件文字识别和网络文件文字识别，识别率还算挺高的，他的用法与语音合成有很多相似之处，当然也有很多不同，例如：

　　from aip import AipOcr''' 你的 APPID AK SK '''APP_ID = '你的 App ID'API_KEY = '你的 Api Key'SECRET_KEY = '你的 Secret Key'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)首先是使用的模块不同，其次参数也不同，可以看出来第一步配置就是这么简单。

　　然后我们需要对本地文件进行一个识别，例如：

　　可以看出来，这些就是识别后图片上的内容，识别效果很好，非常完美。

　　文字识别——请求参数详情

　　参数名称

　　是否必选

　　类型

　　可选值范围

　　默认值

　　说明

　　image

　　是

　　string

　　图像数据，base64编码，要求base64编码后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/png/bmp格式

　　url

　　是

　　string

　　图片完整URL，URL长度不超过1024字节，URL对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/png/bmp格式，当image字段存在时url字段失效

　　language_type

　　否

　　string

　　CHN_ENG ENG POR FRE GER ITA SPA RUS JAP KOR

　　CHN_ENG

　　识别语言类型，默认为CHN_ENG。可选值包括：- CHN_ENG：中英文混合；- ENG：英文；- POR：葡萄牙语；- FRE：法语；- GER：德语；- ITA：意大利语；- SPA：西班牙语；- RUS：俄语；- JAP：日语；- KOR：韩语；

　　detect_direction

　　否

　　string

　　true false

　　false

　　是否检测图像朝向，默认不检测，即：false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true：检测朝向；- false：不检测朝向。

　　detect_language

　　否

　　string

　　true false

　　false

　　是否检测语言，默认不检测。当前支持（中文、英语、日语、韩语）

　　probability

　　否

　　string

　　true false

　　是否返回识别结果中每一行的置信度

　　文字识别——返回数据参数详情

　　字段

　　必选

　　类型

　　说明

　　direction

　　否

　　number

　　图像方向，当detect_direction=true时存在。- -1:未定义， - 0:正向， - 1: 逆时针90度， - 2:逆时针180度， - 3:逆时针270度

　　log_id

　　是

　　number

　　唯一的log id，用于问题定位

　　words_result_num

　　是

　　number

　　识别结果数，表示words_result的元素个数

　　words_result

　　是

　　array

　　定位和识别结果数组

　　+words

　　否

　　string

　　识别结果字符串

　　probability

　　否

　　object

　　行置信度信息；如果输入参数 probability = true 则输出

　　+average

　　否

　　number

　　行置信度平均值

　　+variance

　　否

　　number

　　行置信度方差

　　+min

　　否

　　number

　　行置信度最小值

　　可以看出这个API还是相当不错了，下面我们聊一下图片格式转换器，

　　二、图片格式转换器

　　图片格式转换器，顾名思义就是将图片格式互相转换，很多人为了方便都是直接改后缀名，殊不知那样图盘的原始样式会受到影响，也许图片会打开后从产生错误的画面。下面我们就来做一个类似的案例。

　　1.先安装图片处理模块 pillow ，安装方法：

　　pip install pillow2.导入pillow

　　from PIL import Image3.判断文件是否可以打开

　　from PIL import Imagedef isbad(path): bad = True try: Image.open(path).verify() #判断图片是否损坏 except: bad= False return bad4.转换文件格式

　　def translate(path): if isbad(path): try: str = path.rsplit('.', 1) output_path = str[0] + '.png' #输出文件名称 im = Image.open(path) im.save(output_path) #保存目标文件 return True except: return False else: return False这样我们就得到了一张完整的可用的png图片了，代码如图：

　　本项目用于平时上传文件识别图片所用，效果还是蛮不错的，希望大家喜欢。

总结

以上是真正的电脑专家为你收集整理的文本转换器的在线转换方法(python如何识别图片中的文本)的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得真正的电脑专家网站内容还不错，欢迎将真正的电脑专家推荐给好友。

上一篇：锂离子电池组ln8232 下一篇：上海海昌海洋公园2头长江江豚不幸离世？官方回应