识别用资源:
1.tess-two:由谷歌爸爸负责维护 一直是口口相传的标准
最近更新日期:
三个月前
实际体验:
- 支持的平台很多
- 如果把module中所有.so 都编译一遍速度巨慢(大概八分钟) 需要NDK编译
- 需要提前下载不同语言版本的tess-data
识别成果:
YOU CAN 0NI.Y
BE 08 0000
AS YOUR TASTE
参考文章:
一步一步教你如何在android使用tesseract识别文字(一)很遗憾这个系列并没有第二篇
相关链接:
tesseract(Tesseract Open Source OCR Engine (main repository))
tess-two(Fork of Tesseract Tools for Android)
2.Microsoft Computer Vision(商用收费)
最近更新日期:
9天前
微软牛津计划在计算机视觉方向提供如下服务:
图片检测分析
OCR光学字符识别
生成缩略图
实践体验:
- 示例完整 所有请求都在
VisionServiceClient
的封装中 - 除Android支持外还有在python和windows上的示例代码
- 目前只支持英文
识别成果:
YOU CAN ONLY
BE AS GOOD
AS YOUR TASTE
完美!
价格:
计算机视觉API
级别 | 限额 | 价格 |
---|---|---|
免费 | 限每月5000次API调用 | 免费 |
标准 | 限每秒10次API调用 | 每1000次调用$1.50 |
参考文章:
微软认知服务开发实践(1) - 牛津计划简介
微软认知服务开发实践(2) - 计算机视觉
相关链接:
3.Deep Speech 2
End-to-End Speech Recognition in English and Mandarin
Deep Speech:百度硅谷人工智能实验室利用单学习算法实现英语和汉语识别