Python文字识别功能

it2024-07-27  35

Python文字识别功能

准备:

1、百度云账号

2、电脑

3、Pycharm以及python解释器安装到电脑中

正题:上面是记录如何做的,直接第四步就可已成功文字识别功能里面的片换成你想要识别的图片,名字自己定,但须把代码里图片的名字改成相应的

1、登录百度智能云——在产品中找到—人工智能—文字识别——在界面里面选择“创建应用”

输入应用名称和下面的应用描述,然后创建应用即可

2、成功后选择应用列表找到你创建的应用

 

应用名称:是你起的应用名

AppID:是你应用的id

API Key:接口的密匙

Secret Key:应用的密匙

当然这个接口的文字识别只是一个识别功能,还能识别很多你可以自行查看

 

3、点击左侧的技术文档可以查看这个接口的说明书

 

 在说明书里会告诉你文字识别所需的代码

4、进入pycharm中的Terminal里输入pip install requests,安装requests接口,程序需要(下面截图里的代码打错了)

 

以上准备完毕后,下面是我的代码,都是从帮助文档里面考出来改成我自己需要的部分,运行即可成功

import requests

import base64

# 为进入做准备;拿到卧室的钥匙

# client_id 为官网获取的AK, client_secret 为官网获取的SK

#将“文字识别技术0303”的信息存到host中

host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=ewVGYUOnoomW2G1hyl18hPVF&client_secret=TGCG0BzlRrKZaAjz5MUaa02LPMAUT8xA'

#通过host里面的信息,请求百度云中API的链接

response = requests.get(host)

# print(type(response))

#如果有请求输出请求的数据,这里输出数据的主要密匙

if response:

print(response.json()['access_token'])

# 让计算机读取文件,以2进制的形式读取,存到f里

f = open('金牛座.jpg','rb')

# print(f.read())

#将计算机读取到的信息转换成base64编码,因为图像数据,base64编码后才能进行urlencode;urlencode:是一种编码方式,为了解决中文乱码问题

img = base64.b64encode(f.read())

#将img变成一个字典

data={'image':img}

headers = {'content-type': 'application/x-www-form-urlencoded'}#键和值

access_token = response.json()['access_token']#将请求数据里面得access_token这条密匙存到access_token里

#请求地址和密匙存到my_room中

my_room = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic'+"?access_token="+access_token

# 请求api的功能

req = requests.post(url = my_room, data=data, headers= headers)

#将api处理后的结果并解析'words_result'的内容存到results中,

results = req.json()['words_result']

print(results)

#将结果存到a.txt文件中

with open('a.txt','a+') as f:

for i in results:

f.write(i['words'])

#print(i['words'])


最新回复(0)