TesseractOCR

TesseractOCR

最近研究并学习了一下 TesseractOCR ,它是一款由HP实验室开发由 Google 维护的开源 OCR(Optical Character Recognition , 光学字符识别)引擎。

iOS 上初步的使用 TesseractOCR 进行图像文字提取。

1、在 github 下载图像识别demo源码:Tesseract OCR ----https://github.com/gali8/Tesseract-OCR-iOS,默认英文识别。

2、中文识别:增加并替换文字库,字库链接 https://github.com/tesseract-ocr/tessdata

增加:在 tessdata 文件夹中,你会看到只有一个 eng.traineddata 的英文文字库,这个时候你需要去下载中文文字库: chi_sim.traineddata ,并将其拷贝到 tessdata 文件夹中。
替换:修改代码,@"eng" -- @"chi_sim"

//    G8RecognitionOperation *operation = [[G8RecognitionOperation alloc] initWithLanguage:@"eng"];
    G8RecognitionOperation *operation = [[G8RecognitionOperation alloc] initWithLanguage:@"chi_sim"];

问题来了:这个时候会发生两种问题:

第一: actual_tessdata_num_entries_ <= TESSDATA_NUM_ENTRIES:Error:Assert failed:in file tessdatamanager.cpp, line 53 这是字库版本不对的问题,需要在字库链接中选中分支 (Branch),选择不同的版本 (tag)。本人使用 3.04.00 。这样就不会报错了。

第二:字库正常的情况下,点击识别的时候立刻退出的情况。会出现 allow_blob_division 这个问题。
对于 Windows用户来说,可以参考这篇文章:http://www.cocoachina.com/bbs/read.php?tid-1680510.html。大概思路是重新联立这个中文字库。

对于 Mac 用户来说,很抱歉,我暂时也没找到解决办法,有一个想法是通过 Windows 的计算机把这个字库文件暂时修改后,转移到 tessdata 文件夹来进行操作。 PS :未经尝试。

优化识别功能。

因为 TessractOCR 进行图片文字提取耗时比较久,于是,结合 OpenCV 框架首先进行图像处理,然后再让 TessractOCR 识别,来达到时间的优化的目的。

例子:身份证识别。

一、第三方框架准备,使用 Cocoapods :
OpenCV 指定版本 3.0.0 不会拉取不成功,其他版本会失败。 TesseractOCRiOS 是一个大神专门为了 iOS 系统对 TessractOCR 的 OC 封装。

platform :ios, ‘8.0’

target '身份证识别' do
 pod 'OpenCV', '~> 3.0.0'
 pod 'TesseractOCRiOS', '~> 4.0.0'
end

二、图像处理技术:
1、灰度化处理:将指定图片每个像素点的 RGB 三个分量通过算法计算出该像素点的灰度值,将图像的色彩信息进行移除。

cvtColor(resultImage, resultImage, cv::COLOR_BGR2GRAY);

2、二值化:将经过灰度处理的图片转换为只包含黑白二色的图像。图像中只存在 255(白色) 或者 0(黑色)。
二值化参考网址:https://blog.csdn.net/u013270326/article/details/72897507
https://www.jianshu.com/p/6efd324e8677

cv::threshold(resultImage, resultImage, 80, 255, CV_THRESH_BINARY);

3、腐蚀:将二值图中的黑色进行放大。将图片中黑色文字或者头像区域连城一体,形成一个黑色区域(文字形成的区域一般是矩形)。

    cv::Mat erodeElement = getStructuringElement(cv::MORPH_RECT, cv::Size(26,26));
    cv::erode(resultImage, resultImage, erodeElement);

4、轮廓检测:图片经过腐蚀之后形成一个一个的矩形区域,通过轮廓检测,能把一个一个的矩形塞到一个类似于数组这样的集合中。我们就可以通过特征算法获取到身份证的区域。并把这个区域的图片单独提取出来,进行 TesseractOCR 图像信息提取。

  // 轮廓检测
    std::vector<std::vector<cv::Point>> contours; // 定义一个容器来存储所有检测到的轮廓
    cv::findContours(resultImage, contours, CV_RETR_TREE, CV_CHAIN_APPROX_SIMPLE, cvPoint(0, 0));
    
    // 取出身份证号码区域
    std::vector<cv::Rect> rects;
    cv::Rect numberRect = cv::Rect(0,0,0,0);
    std::vector<std::vector<cv::Point>>::const_iterator itContours = contours.begin();

    for ( ; itContours != contours.end(); ++itContours) {
        cv::Rect rect = cv::boundingRect(*itContours);
        rects.push_back(rect);
        //算法原理
        if (rect.width > numberRect.width && rect.width > rect.height * 5) {
            numberRect = rect;
        }
    }

三、文字识别技术。直接使用封装好的 TessractOCRiOS 方法进行图片识别。

dispatch_async(dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0), ^{
        G8Tesseract *tesseract = [[G8Tesseract alloc] initWithLanguage:@"eng"];
        tesseract.image = [image g8_blackAndWhite];
        tesseract.image = image;
        // Start the recognition
        [tesseract recognize];
        //执行回调
        dispatch_async(dispatch_get_main_queue(), ^{
            completeBlock(image, tesseract.recognizedText);
        });
    });

具体代码如下:

一、 viewController 调用代码:

//适用获取所有媒体资源,只需判断资源类型
- (void)imagePickerController:(UIImagePickerController *)picker didFinishPickingMediaWithInfo:(NSDictionary<NSString *,id> *)info{
    NSString *mediaType=[info objectForKey:UIImagePickerControllerMediaType];
    UIImage *srcImage = nil;
    //判断资源类型
    if ([mediaType isEqualToString:@"public.image"]){
        srcImage = info[UIImagePickerControllerEditedImage];
        self.imageView.image = srcImage;
        //识别身份证
        self.textLabel.text = @"图片插入成功,正在识别中...";
        [[RecognizeCardManager shareManager] recognizeCardWithImage:srcImage complete:^(UIImage *cropImage, NSString *text) {
            if (text != nil) {
                self.textLabel.text = [NSString stringWithFormat:@"识别结果:%@",text];
                NSLog(@"%@", self.textLabel.text);
                CGFloat width = cropImage.size.width;
                CGFloat height = cropImage.size.height;
                if (cropImage.size.width > self.view.bounds.size.width) {
                    width = self.imageView.frame.size.width;
                }
                
                if (cropImage.size.height > self.imageView.frame.size.height) {
                    height = self.imageView.frame.size.height;
                }
                UIImageView *imageView = [[UIImageView alloc] initWithFrame:CGRectMake(0, CGRectGetMinY(self.imageView.frame), width, cropImage.size.height)];
                imageView.contentMode = UIViewContentModeScaleAspectFit;
                imageView.image = cropImage;
                UIWindow *window = [[UIApplication sharedApplication] keyWindow];
                [window addSubview:imageView];
            }else {
                self.textLabel.text = @"识别失败";
            }
        }];
    }
    [self dismissViewControllerAnimated:YES completion:nil];
}

二、 recognizeCardManager 代码:
.h

#import <Foundation/Foundation.h>

@class UIImage;

typedef void (^CompleteBlock) (UIImage *cropImage, NSString *text);

@interface RecognizeCardManager : NSObject

+ (instancetype)shareManager;

- (void)recognizeCardWithImage:(UIImage *)cardImage complete:(CompleteBlock)completeBlock;

- (void)tesseractRecogniceWithImage:(UIImage *)inputImage complete:(CompleteBlock)complete;

@end

.m

#import "RecognizeCardManager.h"
#import <opencv2/opencv.hpp>
#import <opencv2/imgproc/types_c.h>
#import <opencv2/imgcodecs/ios.h>
#import <TesseractOCR/TesseractOCR.h>


@implementation RecognizeCardManager

+ (instancetype)shareManager
{
    static RecognizeCardManager *manager = nil;
    static dispatch_once_t onceToken;
    
    dispatch_once(&onceToken, ^{
        manager = [[RecognizeCardManager alloc] init];
    });
    return manager;
}

- (void)recognizeCardWithImage:(UIImage *)cardImage complete:(CompleteBlock)completeBlock
{
    // 扫描身份证图片,并进行预处理,定位号码区域图片并返回
    UIImage *numberImage = [self opencvScanCard:cardImage];
//    UIImage *numberImage = cardImage;
    if (numberImage == nil) {
        completeBlock(numberImage, nil);
    }
    
    // TesseractORC识别文字
    [self tesseractRecognizeImage:numberImage complete:^(UIImage *cropImage, NSString *numberText) {
        completeBlock(numberImage, numberText);
    }];
}

- (UIImage *)opencvScanCard:(UIImage *)image
{
    // 将UIImage 转换成mat
    cv::Mat resultImage;
    UIImageToMat(image, resultImage);
    
    // 转为灰度
    cvtColor(resultImage, resultImage, cv::COLOR_BGR2GRAY);

    // 利用阀值二值化
    cv::threshold(resultImage, resultImage, 80, 255, CV_THRESH_BINARY);
    
    // 腐蚀,填充(腐蚀背景)
    cv::Mat erodeElement = getStructuringElement(cv::MORPH_RECT, cv::Size(26,26));
    cv::erode(resultImage, resultImage, erodeElement);
    
    // 轮廓检测
    std::vector<std::vector<cv::Point>> contours; // 定义一个容器来存储所有检测到的轮廓
    cv::findContours(resultImage, contours, CV_RETR_TREE, CV_CHAIN_APPROX_SIMPLE, cvPoint(0, 0));
    
    // 取出身份证号码区域
    std::vector<cv::Rect> rects;
    cv::Rect numberRect = cv::Rect(0,0,0,0);
    std::vector<std::vector<cv::Point>>::const_iterator itContours = contours.begin();

    for ( ; itContours != contours.end(); ++itContours) {
        cv::Rect rect = cv::boundingRect(*itContours);
        rects.push_back(rect);
        //算法原理
        if (rect.width > numberRect.width && rect.width > rect.height * 5) {
            numberRect = rect;
        }
    }
    
    //身份证号码定位失败
    if (numberRect.width == 0 || numberRect.height == 0) {
        return nil;
    }
    //定位成功成功,去原图截取身份证号码区域,并转换成灰度图、进行二值化处理
    cv::Mat matImage;
    UIImageToMat(image, matImage);
    resultImage = matImage(numberRect);
//    resultImage = matImage;
    cvtColor(resultImage, resultImage, cv::COLOR_BGR2GRAY);
    cv::threshold(resultImage, resultImage, 80, 255, CV_THRESH_BINARY);
    //将Mat转换成UIImage
    UIImage *numberImage = MatToUIImage(resultImage);
    return numberImage;
}

//利用TesseractOCR识别文字
- (void)tesseractRecognizeImage:(UIImage *)image complete:(CompleteBlock)completeBlock {
    
    dispatch_async(dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0), ^{
        G8Tesseract *tesseract = [[G8Tesseract alloc] initWithLanguage:@"eng"];
        tesseract.image = [image g8_blackAndWhite];
        tesseract.image = image;
        // Start the recognition
        [tesseract recognize];
        //执行回调
        dispatch_async(dispatch_get_main_queue(), ^{
            completeBlock(image, tesseract.recognizedText);
        });
    });
}

- (void)tesseractRecogniceWithImage:(UIImage *)inputImage complete:(CompleteBlock)complete
{
    [self tesseractRecogniceWithImage:inputImage complete:complete];
}

@end

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容

  • 1、通过CocoaPods安装项目名称项目信息 AFNetworking网络请求组件 FMDB本地数据库组件 SD...
    阳明先生x阅读 15,967评论 3 119
  • 最近上对从图像里识别出文字比较感兴趣, 用专业点的语言描述就是(OCR光学字符识别窥探)非常牛X的名字, 就想弄一...
    小Ju阅读 6,575评论 9 7
  • 这一次的清迈之行是毫无攻略的走哪是哪。听说过无数次的拜县,也差点因为要坐3个多小时的车而放弃。庆幸最终到达了这里。...
    雪青啊阅读 96评论 0 0
  • 我有一颗羊脂球阅读 121评论 0 1
  • 一直以来在朋友眼中我就是个嗜酒者,自己特别爱喝德国啤酒、威士忌以及葡萄酒。年轻的时候因为工作应酬关系对酒基本上是浪...
    对着空气说情话阅读 1,888评论 0 0