社区选举中使用的表格识别是什么(社区选举中使用的表格识别怎么写)
导语:社区选举中使用的表格识别
快档通表格识别就搜:OCR徐美玲 计算机选举系统主要通过机器视觉算法对选票进行定位,并对定位到的信息进行识别和处理[1],其中在社区选举系统中,选票图像中包含着表格,选举人的信息分布在表格单元中,因此若要对选举信息进行定位,最重要的一个步骤就是识别选票图像中的表格信息。在现有的社区选举系统中,根据选举内容设计选举需要的选票,并在选票左右两侧设置同步道,如图1所示,通过对同步道定位间接定位到候选人信息块。设置同步道不仅增加了选票设计的复杂度,还需要在系统中预定义较多信息块相对位置信息的参数,并且如果信息块的位置在印刷中出现偏差,会导致表格识别错误的问题。为了降低选票设计的复杂度,减少预定义的参数信息,需要采用更加简便快速的方法提取并识别选票图像中的表格,并能够按照一定的方法描述表格以方便确定信息块的位置。
在目前的表格识别算法中,采用投影法确定表格框线坐标,然后利用搜索法确定表格框线的长度变换提取表格中的直线,计算量过大;直接利用数学形态学去获取表格中的框线,对形态学操作采用的结构化元素要求很高;而采用投影法确定表格框线时,其中较短的表格线易受其中文字的影响。
常用的选票图像中,表格框线的特征比较明显,且表格框线间的间距较大,因此本文先用数学形态学的方法腐蚀掉其中的文字信息,再采用投影法确定横纵直线的坐标,然后利用检索横纵直线交点的特征类型,绘制特征点矩阵来识别选票中的表格。这种算法可以减少文字信息对表格框线识别的影响,以特征点矩阵来描述表格结构的方式,方便了信息块位置的描述和确定,不需要再通过同步道来定位信息块,明显降低了选票设计的复杂度,选票也更加简洁。1图像预处理选票预处理包括将扫描到的选票图像进行二值化处理
[if !supportLists]1. [endif]1边缘检测
边缘检测的目的是标识数字图像中亮度变化明显的点,是图像纹理特征的重要信息源和形状特征的基础,其实质是提取图像中对象与背景的交界线。有许多方法用于边缘检测,它们的绝大部分可以划分为两类[6]:基于查找的方法和基于零穿越的方法。基于查找的方法通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向;基于零穿越的方法通过寻找图像二阶导数零穿越来寻找边界,通常是Laplacian过零点或者非线性差分表示的过零点。常用的边缘检测算法有Sobel算子、Laplacian算子和Canny算子等,其中,Canny算子的效果较好[7-9]。Canny算子采用高斯滤波器平滑图像,再用一阶偏导的有限差分来计算梯度的幅值和方向,然后对梯度幅值进行非极大值抑制,最后用双阈值算法检测和连接边缘。表格识别选票表格识别的目的就是为了确定表格的框架,提取表格单元中的信息进行进一步的识别。在上述操作之后,得到了腐蚀掉文字信息保留表格框线的选票图像。在选票图像中,表格的横线和纵线与其他信息相比,特征比较明显,利用垂直和水平投影即可确定横线和纵线的坐标,然后进行进一步的表格识别和表述。2.1横纵直线的坐标确定一幅二值化图像可以用一个二维数组来表示,
表格识别
选票表格识别的目的就是为了确定表格的框架,提取表格单元中的信息进行进一步的识别。在上述操作之后,得到了腐蚀掉文字信息保留表格框线的选票图像。在选票图像中,表格的横线和纵线与其他信息相比,特征比较明显,利用垂直和水平投影即可确定横线和纵线的坐标,然后进行进一步的表格识别和表述。
结语
本文对社区选举系统中常用选票中的表格采用投影法和构造表格特征点矩阵的方法进行识别。在信息块的提取方面,不再设置同步道,只需在系统中预定义信息块由哪几条横纵线组成即可。这种方法大幅降低了选票制作的难度,减少了需要在系统中预定义的参数信息,并提高了选举系统中表格识别算法的通用性,对表格断裂有较好的修复效果,提升了用户体验。但是本文确定横纵线的坐标是依靠投影法,当选票中存在相邻表格线间距非常小时,对在确定表格线坐标时选取的阈值要求较高。
本文内容由小开整理编辑!