时间:2021-10-03 17:02:33 | 栏目:Android代码 | 点击:次
1.准备工作
2.实现细节
1.首先是tess-two的用法。
app下的build.gradle的配置如下
android { defaultConfig { .... ndk { abiFilters 'armeabi' //自行选择添加 } } } dependencies { compile 'com.rmtheis:tess-two:8.0.0' }
识别方法:
public String detectText(Bitmap bitmap) { TessBaseAPI tessBaseAPI = new TessBaseAPI(); String path = ""; //训练数据路径 tessBaseAPI.setDebug(true); tessBaseAPI.init(path, "eng"); //eng为识别语言 tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789"); // 识别白名单 tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "!@#$%^&*()_+=-[]}{;:'\"\\|~`,./<>?"); // 识别黑名单 tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD);//设置识别模式 tessBaseAPI.setImage(bitmap); //设置需要识别图片的bitmap String inspection = tessBaseAPI.getHOCRText(0); tessBaseAPI.end(); return inspection ; }
训练数据可以在tessdata下载,里面包含各种语言。当然你自己也可以训练它,有兴趣的可以学习一下相关内容。
2.从tess-two的用法可以知道,我们最终需要的是识别图片的Bitmap。在扫码项目中我们找到在DecodeHandler类的decode方法中,我们会得到一个PlanarYUVLuminanceSource类的实例。在使用HybridBinarizer算法解析数据源,最终采用MultiFormatReader解析图像出结果。代码大致如下:
Result rawResult = null; MultiFormatReader mMultiFormatReade = new MultiFormatReader(); try { PlanarYUVLuminanceSource source = new PlanarYUVLuminanceSource(```, false); BinaryBitmap bitmap = new BinaryBitmap(new HybridBinarizer(source)); rawResult = mMultiFormatReader.decode(bitmap, mHints); } catch (ReaderException ignored) { } finally { mMultiFormatReader.reset(); }
看完后懵逼了,没有Bitmap。经过一番查找,找到了在旧版的zxing中PlanarYUVLuminanceSource类有renderCroppedGreyscaleBitmap方法,不知为何去除了。。。
3.之后修改了一些相机的参数信息,适配了部分设备的预览效果。基本的页面修改了一下。这里就不赘述了。
走一波,如下效果:
可以发现除了数字以外,它将中文识别为了字母。其实问题首先是我们使用了英文的训练数据,同时白名单设置了a~z的字母。当然你也不能将字母设置为黑名单,那样只会让识别不出的字符识别为乱七八糟的数字。
这里我给出的建议是利用正则去筛选,这样你可以识别你想要的各种格式数据。我这里只是做了手机号的简单识别,大家可以举一反三去处理。
public static String getTelNum(String sParam){ if(TextUtils.isEmpty(sParam)){ return ""; } Pattern pattern = Pattern.compile("(1|861)(3|5|7|8)\\d{9}$*"); Matcher matcher = pattern.matcher(sParam); StringBuilder bf = new StringBuilder(); while (matcher.find()) { bf.append(matcher.group()).append(","); } int len = bf.length(); if (len > 0) { bf.deleteCharAt(len - 1); } return bf.toString(); }
修改后如下:(同时支持多个号码)
当然本项目也保留了扫码功能(可在DecodeHandler中自己添加条码格式):
细心的同学可以从图中看到扫描框的大小都不一样,这里我是改成了可以手动调节大小的扫描框。毕竟扫码模式下,框大一点还是比较好识别(将二维码放入框中有时就费时间)。扫数字这些文字时,框小一点会好识别。具体可以下载自行体验。
最后我将代码已经上传至Github:Tesseract-OCR-Scanner
总结