基于图像预处理的二维码识别技术的研究教材 下载本文

内容发布更新时间 : 2024/5/4 21:15:50星期一 下面是文章的全部内容请认真阅读。

《计算机视觉》 指导教师:梁栋

基于图像预处理的二维码识别技术的研究

摘要:随着计算机科学技术的发展,自动识别技术得到了广泛的应用。在众多自动识别的技术中,条码技术已经成为当今主要的计算机自动识别技术之一。为解决条码信息容量有限的问题,九十年代以来出现一种新的条码——二维码。

二维码是指在平面二维方向上,使用某种特定的几何图形按一定规律分布的黑白相间的,用以记录信息的符号。在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理:它具有条码技术的一些共性:每种码制有其特定的字符集;每个字符占有一定的宽度;具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形旋转变化等特点。

二维码主要分为两大类:一是堆叠式是二维码,其主要代表是pdf417;二是矩阵式二维

码,主要包括QR码和Data Matrix码。在现代商业活动中,二维码以其低成本、快速识读、含有大量信息而广泛应用于各个行业,如:产品防伪/溯源、广告推送、网站链接、数据下载、商品交易、定位/导航、电子凭证、车辆管理、信息传递、名片交流、wifi共享等,人们通过手机二维码的扫描软件就可以轻松获得二维码中所储藏的信息。

对QR码进行识别需要使用采集设备采集的图像,但图像的采集过程中由于受到各种因

素(如光照不均匀、拍摄角度、二维码有褶皱等)的影响,可能导致二维码图像背景有各种噪声,收到的图像可能存在几何畸变或者图像有阴影,从而导致识读设备很难识读,给解码带来相当大的困难。因此,如何对收集到的图像进行适当的去噪和校正已成为二维码识别的关键问题。

本文主要针对异常QR码以及Data Matrix码的识别进行描述,先表明二维码识别要解

[1]

决的问题、任务和框架,并对现有方法进行阐述,最后讨论二维码识别技术仍需解决的问题,并展望看其未来研究方向。

1. 二维码识别的概念框架

随着二维码的广泛使用,二维码被广泛认知,当人们遇到二维码扫描失败的时候,对其

产生的影响也是巨大的,人们会怀疑是不是产品是假的,或者是有诈骗信息,但其主要问题可能是:

1) 二维码的扫描不够精确; 2) 不是真的二维码图形;

1

《基于图像处理的二维码识别技术的基本研究》 作者:丁真真

3) 更新的条码种类未被录用到扫描软件中; 4) 二维码图案被破坏,或没有处于理想状态下;

上述问题只是二维码不能识别的部分原因,就上述问题,还没有某一款软件或产品能够

同时解决上面所有的问题,由此,二维码的识别过程中所要完成的主要任务,即在用二维码软件扫描二维码时,先对其图案进行图像的预处理,使其符合各二维码的种类规范,然后再对其进行读取。

基于图像预处理的二维码识别的基本流程包括:图像灰度化、图像滤波、光照均衡化、

图像分割、图像二值化、边缘检测、图像定位、图形旋转,失真校正等。

本文主要总结针对二维码图形预处理的方法,以期能够提高二维码的识别度。

2. 二维码条码

2.1 QR码简介

QR码是快速识别矩阵码(quick response code)的简称,最早由日本DENSO公司

在1994年9月推出,我国于2000年底颁布了QR码的国家标准。QR码符号呈正方形,由空白区、功能图形区、数据图形区组成。功能图形区又分为位置探测图形、校正图形、格式信息、版本信息、定位图形等不同的图形形式,如图1 所示。

各部分图形都由深色模块(代表二进制1)或浅色模块(代表二进制0)组成,位置清晰,功能性强,有利于进行图像处理和识别[2]。根据编码数据量的多少,QR码可以分为40个版本,从版本1到版本40,符号容量越来越大,相应的图形所占的面积也增大,每增大一个版本,符号图像的每边就多出4个模块。QR码有较强的数据容错能力,使用Reed —Solomon码进行查错控制。根据需要,可设置L、M、Q、H四个纠错等级,分别可恢复传输或识读出错的7%、15%、25%、30%的码字信息。详见文献[3]3-10,[4]93-95。

QR码的基本特点:

①识读速度超高; ②全方位读取;

③能够有效编码中国汉字和日本汉字。

2

《计算机视觉》 指导教师:梁栋

图 1 QR码的符号结构

2.2 Data Matrix的简介[4]

Data Matrix二维码(DM码)是由美国国际资料公司于1989年发明的,DM是矩阵式二维条码,其发展的初衷是在较小的标签上嵌入更多的资料信息。DM的最小尺寸是目前条码中最小的,尤其适用于小零件的标识,直接印刷在实体上。DM分为ECC000—ECC140和ECC200两种类型,ECC000—ECC140具有多种不同等级的错误纠错功能,而ECC200则通过Reed-Solomon纠错算法产生多项式计算出错误纠错码,不同尺寸的ECC200符号应有不同数量的错误纠错词。由于DM只需读取资料的20%即可精确辨认,因此很适合在条码容易受损的场合,例如在暴露于高热、化学剂清洗、机械腐蚀等特殊环境的零件上。

DM码最大特点就是存储效率高,因此被广泛应用于标示集成电路、药品等小件物品。如图2所示,DM码看起来像是一个由黑白两种颜色组成的点阵组合,每一个相同大小的黑色或白色方格成为一个数据单位。矩阵中的1、0就是DM的黑白两色小方格,及数据单位。

图2 DM码示例

3