遇到一个需求,需要识别图片中的文字,可以通过调用百度的ocr接口轻松实现。
1、打开百度图文识别网站:https://console.bce.baidu.com/ai/#/ai/ocr/overview/index,输入账号密码登录;
2、进入后点击创建应用
3、自定义一个应用名称
文字识别包名可选不需要,应用描述随便填写,
4、点击立即创建,出现如下图,点击查看应用详情
申请到的API Key和Secret Key如图,即可使用。
5、使用步骤,以JavaScript为例
5.1 图片转换成base64格式
var path = "/sdcard/pic/test01.jpg"; var imag64 = images.toBase64(images.read(path));
5.2 获取access_token
var getTokenUrl="https://aip.baidubce.com/oauth/2.0/token";
var token_Res = http.post(getTokenUrl, {
grant_type: "client_credentials",
client_id: API_Key, //API Key
client_secret: Secret_Key, //Secret Key
});
var access_token = token_Res.body.json().access_token;
5.3 调用百度ocr通用文字识别API
var ocrUrl = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"; var ocr_Res = http.post(ocrUrl, { headers: { "Content-Type": "application/x-www-form-urlencoded" }, access_token: access_token, //5.2生成的token image: imag64, //5.1生成的base64编码 language_type:"CHN_ENG" }); var json = ocr_Res.body.json();
得到json格式结果:
{ "words_result": [ {"words": "小微"}, {"words": "测试"} ], "log_id": 2471272194, "words_result_num": 2 }