2019-07-11 ActionScript3.0使用百度智能API OCR识别图片中文字

昨天开始使用百度的API来整合到图片提取工具中,
百度OCR通用版本的识别免费次数有50000次/天,应该满足需求。

因为没有现有的AS3代码实现,所以参考网上JAVA代码实现
API地址:
https://cloud.baidu.com/doc/OCR/OCR-API/24.5C.E8.BF.94.E5.9B.9E.E8.AF.B4.E6.98.8E.html
https://cloud.baidu.com/doc/OCR/s/zjwvxzrw8/

先用百度帐号登录百度智能,点击“管理控制台”进到后台管理页。
选择产品 ===>文字识别
创建一个应用,就可以获得appid/appKey/serectKey.调用的时候需要用这三个值去获得token

调用的逻辑
1,程序打开的时候,先获取access_token.

/**百度文字识别(高精度版)的路径**/
public static var ocr_url_1:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic";     
/**百度文字识别(通用版)的路径**/
public static var ocr_url_2:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";      
/**百度签权URL,获取TOKEN**/
public static var ocr_token_url:String = "https://aip.baidubce.com/oauth/2.0/token";
public function startCheckApp():void
        {
            var req:URLRequest = new URLRequest();
            req.url = OCRBaiduDefault.ocr_token_url;
            req.method = URLRequestMethod.POST;
            var val:String = "grant_type=client_credentials&client_id={1}&client_secret={2}";//参数说明自行查看官方文档
            val = val.replace("{1}",OCRBaiduDefault.ocr_apiKey).replace("{2}",OCRBaiduDefault.ocr_screctKey);
            req.data = new URLVariables(val);
            
            var loader:URLLoader = new URLLoader();
            loader.addEventListener(Event.COMPLETE,onRequsetToken);
            loader.load(req);       
        }
        
        
        private function onRequsetToken(e:Event):void
        {
            var str:String = e.target.data;
            var res:Object = JSON.parse(str);
            if(res.hasOwnProperty("error_code"))
            {
                trace("报错:"+str);
            }
            else
            {
                var token:String = res.access_token;
                var time:* = res.expires_in;
                OCRBaiduDefault.ocr_access_token = token;//获取到的token值保存在静态变量里
            }
        }

2,把本地的图片加载,获得二进制数组.这一段是基础的加载ByteArray

private function onClick(e:*):void
{
    var url:String = "G:/Aproj6Haiwai/taiwan_ws/client/proj/bin/h5/res/art/artifact2/lz_lingzhen_hose_01.png";
    var loader:URLLoader = new URLLoader();
    loader.dataFormat = URLLoaderDataFormat.BINARY;
    loader.addEventListener(Event.COMPLETE,onLoaded);
    loader.load(new URLRequest(url));
}
private function onLoaded(e:Event):void
{
    var bytes:ByteArray = e.target.data;
    OCRReqManager.getIns().startOCRrequest(bytes);
}

3,把二进制数组进行编码Base64,再用encodeURI编码
4,把token当成url参数,请求头Content_Type 设置为application/x-www-form-urlencoded。

public function startOCRrequest(bytes:ByteArray):void
        {
            var req:URLRequest = new URLRequest();
                        var base64:String = Base64.encodeByteArray(bytes);  
            baseStr = baseStr.replace("\n","");
            var variables:URLVariables = new URLVariables();
            variables.image = baseStr;
            req.data = variables;
            //开始用这种写法,
            //一直报216201 image format error.也不知道为啥
            //base64 = encodeURI(base64);
            //var val:String = "image={1}";
            //val = val.replace("{1}",base64);
            //req.data = new URLVariables(val);                 
            
            //https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token="前面获取的token值"
            req.url = OCRBaiduDefault.ocr_url_2 + "?access_token="+OCRBaiduDefault.ocr_access_token;
            req.method = URLRequestMethod.POST;         
            var header:URLRequestHeader = new URLRequestHeader("Content-Type","application/x-www-form-urlencoded");
            req.requestHeaders.push(header);
            
            var loader:URLLoader = new URLLoader();
            loader.addEventListener(Event.COMPLETE,onRequestBack);
            loader.load(req);       
        }
        
        private function onRequestBack(e:Event):void
        {
            var str:String = e.target.data;
            var res:Object = JSON.parse(str);
            if(res.hasOwnProperty("error_code"))
            {
                trace("报错:"+str);
            }
            else
            {
                var backVo:OCRBaiduVo = OCRBaiduVo.encodeJSON(str);
            }
        }

返回值

{"log_id": 7247048436949274572, "words_result_num": 3, "words_result": [
  {"words": "角色连击酷炫外观"}, {"words": "等你来寻宝!"}, {"words": "小手一抖,葫芦到手"}
]}

这里踩了个坑,就是开始用variables.encode(str)这种方法,把base64码传进的时候,报错,虽然网页的Network记录看起来发送是一样的。这里卡住我挺久的。

知识点

1.一般网络请求,提交图片文件都用Base64格式,通过post的参数

另外

尝试了google tesseract OCR 工具
安装和环境变量配置:
https://blog.csdn.net/qq_40147863/article/details/82285920
教程上说自己下载语言包,实际在安装时选中要安装的语言包就可以了
下载了最新版本5.0.0,项目中的图片因为不是正楷字,辨识太差了,所以不考虑。
如果今后用到辨识端正的字体或数字,应该还是可以用的

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,636评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,890评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,680评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,766评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,665评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,045评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,515评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,182评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,334评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,274评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,319评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,002评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,599评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,675评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,917评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,309评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,885评论 2 341

推荐阅读更多精彩内容