• 工作总结
  • 工作计划
  • 心得体会
  • 述职报告
  • 事迹材料
  • 申请书
  • 作文大全
  • 读后感
  • 调查报告
  • 励志歌曲
  • 请假条
  • 创先争优
  • 毕业实习
  • 财神节
  • 高中主题
  • 小学一年
  • 名人名言
  • 财务工作
  • 小说/有
  • 承揽合同
  • 寒假计划
  • 外贸信函
  • 励志电影
  • 个人写作
  • 其它相关
  • 生活常识
  • 安全稳定
  • 心情短语
  • 爱情短信
  • 工会工作
  • 小学五年
  • 金融类工
  • 搞笑短信
  • 医务工作
  • 党团工作
  • 党校学习
  • 学习体会
  • 下半年工
  • 买卖合同
  • qq空间
  • 食品广告
  • 办公室工
  • 保险合同
  • 儿童英语
  • 软件下载
  • 广告合同
  • 服装广告
  • 学生会工
  • 文明礼仪
  • 农村工作
  • 人大政协
  • 创意广告
  • 您现在的位置:六七范文网 > 其它相关 > 正文

    一种基于OCR识别技术的通用计票系统设计

    来源:六七范文网 时间:2023-06-13 09:00:25 点击:

    【摘 要】利用计算机技术提高传统纸质投票的计票效率,避免计算机图像识别产生的拒识和誤识对整个计票过程的干扰,开发出一套高效可视可控的通用计票系统。文章利用高速扫描仪进行纸质选票的图像数据采集,结合准确度较高的印刷体数字和手写体符号OCR识别技术,配合能适应各种投票规则过程的通用性数据库数据结构设计一种通用计票系统。该系统既能保存纸质投票的优点,又能高效地完成数据采集及结果输出,对实际投票特别是会议投票具有一定的实用价值。

    【关键词】计票;投票;扫描;识别

    【中图分类号】TP391.41 【文献标识码】A 【文章编号】1674-0688(2018)09-0063-03

    传统的纸质投票选举过程耗时费力,且不能保证计票过程公平、公正,普遍存在计票效率低下、统计人为误差大等问题,最为突出的问题是对于流程复杂的过程难以高效完成。随着计算机技术的普及,出现了利用计算机网络进行投票的系统,但是系统透明度不高,容易引起争议。传统的纸质投票能很好地保留投票凭据,避免计票结果出来后无法查证选票的麻烦。如何利用计算机技术保留纸质投票的优点,高效完成复杂的投票工作,对于选举活动具有一定的社会价值。2002年,王庆生等[1]发表了题为《利用OMR自动读票的计算机选举系统》的论文,文中指出采用光标阅读机专业设备进行读票。2011年,张站[2]发表了《基于符号识别技术的选举计票系统研究》的学位论文,文章指出“系统离实际应用还有一段距离”。国内也出现了一些同类电子投票箱产品,例如2010年张婷[3]等提出的基于机器识别的智能票箱,但是适用范围窄,设备专一。同时还有一些智能票箱采用的是红、蓝、绿、黄等底色的特殊纸张或填涂卡。2014年,昝丽红[4]提出的系统依然存在一定误差。本文研究的系统是基于常用的黑白激光打印机和高速扫描仪,配合数据库开发一套稳定、实用性强的计票系统,计票过程公开、透明、公平、公正,实现计票结果无误差,具有一定的实用性。

    1 系统设计

    本系统将传统的投票计票过程与计算机技术相结合,提高投票统计效率,避免投票者对结果的猜疑,做到结果完全正确无误差,计票过程可视,真正做到公平、公正、公开。设计原则为使用过程高效,结果无误差,适用各类选举投票活动。系统运行所需主要设备为普通A4黑白激光打印机、滚筒高速扫描仪和普通笔记本电脑,辅助设备可选投影仪。扫描仪接口和识别部分采用C++进行程序编写,主程序采用Delphi进行编程,操作要求简单快捷。投票系统需要满足各种投票流程和规则,将各种规则设置记录到数据库中,在投票时对规则进行判断。

    2 主要功能模块

    2.1 选票设计打印模块

    选票设计首先要考虑选票版面设计。选票版面设计是计算机计票系统构建的第一步,其设计直接关系到OCR过程的复杂度。选票版面设计要考虑投票项目的可增长性、选票版面高效处理性和选票的信息量。结合这3点并考虑打印出的选票是黑白二值单色纸张,最终定为以行列为主的间隔表格,如图1所示。

    采取图1选票版面的目的:①可以在选票上显示足够的信息,保证字体大小适中,方便选举人填选,中间的区域为投票项目的信息显示区,不需要进行识别。②高速进行切分定位(表格线在保证识别的情况下要足够粗,避免出现无法识别水平线的问题)。③能够统计出投票人数信息,避免漏扫(未收或者扫描仪多页进纸当1页扫描),拒绝多次采集(扫描过的页无法进行二次采集输入)。④方便监票人在扫描过程对数据进行核对,确保采集准确性(项目行1页最多15项,方便核对采集的走势)。

    本系统设计了选票设计窗口,方便显示中间区域的投票内容和排版,以及确定本轮次投票的表态栏个数。

    2.2 选票高速扫描模块

    市面上的高速滚筒扫描仪基本是A4幅面,支持TWAIN协议和二值黑白扫描。由于后期需要OCR识别随机码数字和手写体“√”“×”“○”识别,为保证准确性将扫描仪的分辨率设为300 dpi。激光黑白打印机打印出来的图像是黑白图像,并且扫描仪进行黑白二值扫描比相同分辨率的彩色扫描速度要快,所以采用黑白二值扫描图像。高速扫描模块采用C++进行开发,利用通用TWAIN协议即可方便连接扫描仪采集图像。

    本模块需要考虑以下功能:①枚举系统连接或者安装的扫描仪,供操作人员选择。②能设定扫描仪的相关扫描参数。③控制扫描仪能逐页进纸扫描。为了方便对扫描过程进行监控,不能采用预扫描(扫描仪都有一个缓存扫描的模式,这个模式下扫描仪会连续将进纸器上的纸质全部扫描缓存,本系统不推荐这种模式。原因是本系统必须保证扫描统计结果无误差,每扫描一页,这一页的采集数据必须完全正确,监票人在每扫描一页需要核对该页的数据)。④将原始图像以bitmap格式传给选票版面快速识别模块。

    2.3 选票版面快速识别模块

    从扫描仪采集到的图像必须经过预处理,才能进行后续的图像处理和分析。预处理的主要步骤是图像纠偏。纠偏的目的是使图像在一较小的歪斜角度内。由于打印机进纸机构、扫描仪放纸和滚筒进纸都会因机械运行产生偏角,使得本应该垂直的直线变歪了。这个歪角必须在一个合适的范围内,太大可能会导致线条拒识。由于选票模板采用线条,因此本系统采用hough变换获取角度。在获取偏角后纠正图片,利用线条获取每行坐标,并通过线条的经验值像素大小逐步缩小范围,最终获取每个识别字符的最小识别区域。

    2.4 高速OCR识别模块

    本模块负责数字印刷体和手写“√”“×”“○”的识别。左下角的识别码和页码,以及序号列都是印刷体数字。本系统采用KNN算法对选定字体的数字进行识别。5位随机码是特定不连续且具备一定算法,错一位都可以判断出识别错误的计算方法,可靠性比较好。页码识别需要配合左侧序号列进行双重判断,错误率比较低。

    对于填涂区“√”“×”“○”的手写体识别,先进行一次简单的缩放后,直接使用最简单的垂直交点个数的分布进行分类识别,每个识别框的结果可能为空、勾、叉、圈、涂改、无法识别6种结果。手写体的书写可能出现不规范和涂改的情况。本系统规定每一个投票项目都必须表态,如果项目的表态个数(框内黑色像素点个数超过一个笔头印的像素个数,即算该格进行了表态),多余一个表态的项目控制模块会转由人工判断。

    经过大量测试发现,本系统进行实际手写体符号“√”“×”“○”的識别中,“√”的识别结果最好,“×”“○”的误识率较高,主要原因是书写不规范,圈的封闭性没有写规范(可能出现写成“U”的情况,容易和“√”混淆,发生错识),并且“×”的书写由于两笔的连写容易写成封闭的圈和小“×”共存的情况(这种情况容易和“○”混淆,发生错识)。由于标准“√”基本上一笔完成,左边低右边高,书写过程简单,所以书写相对比较规范。本系统实际使用时,为保证足够的进度,建议使用“√”为填写符号。但是“√”写错的情况经常出现在“√”上多打一笔成为差的情况,但是由于本系统的版面是最少两列的情况,也就是同意和不同意分两列同时出现,这样即使填写错,书写为“√”打点的情况,也需要在另外一个表态栏进行续写。这样同一个项目的表态就识别出两个表态区都有表态,交由控制模块弹出人工确定窗口,交由监票员进行确定。

    2.5 投票控制模块

    本模块负责控制每个轮次的进纸,识别及出现识别错误等情况进行数据纠正输入,也负责根据打印排序等要求对每轮结果进行打印,并依据轮次规则,将本轮结果中符合下一轮次的项目导入下一轮次项目中。控制模块的相关参数需要在投票前配置完毕,配置参数保存在数据库中。

    3 程序界面设计

    考虑到同屏投影和实时监票的需求,本系统选票以单页进行显示,每扫描一页显示一页的项目填选情况,同时以数字进行累计得票显示,程序主界面如图2所示。实际监票过程需要人工将刚过扫描仪的选票放置电脑显示器前,供监票人进行页信息和得票走势核对。系统在I5 5200CPU笔记本搭配高速扫描的情况下,大约3秒完成一页进纸和信息采集显示,刚好满足监票人员核对票面信息和采集信息。

    界面部分必须考虑手工输入部分,以免会议上出现扫描仪故障等情况影响投票过程。所以主界面上“√”选手动输入时,输入正确的已经打印出的验证码,则可以在界面表态区点击进行标红预选,在本页全部填写后,根据标红格对本页投票项目的数据进行票数加1。

    为加快手动输入多个表态区数据,如图3所示,动态列出对应表态框的4个按钮,方便点击确认输入。其他相应的界面都以方便查看和操作为设计方向,力求人性化操作。

    4 结语

    本文介绍了一种结合传统纸质投票的电子投票计票系统,该系统利用高速扫描识别计票代替人工统计,体现了监票人的重要性。本系统灵活方便,已经投入各类会议进行计票统计,节省会议时间,得到了一些专家的好评。同时,系统也存在以下不足:①本系统仅适用于中小型投票计票,对于大型投票还是比较耗时。②投票过程采用通用扫描仪,监票人员查票得由操作人员对选票进行手工翻页放到电脑屏幕前,才能实时看清表态的走势。③识别过程中,版面分析是系统的关键,如果能结合条码识别会提高版面识别效率。④本系统不支持数字手写体识别,所以不支持排序输入(手写体数字)进行选票排序投票。

    参 考 文 献

    [1]王庆生,张剑.利用OMR自动读票的计算机选举系统[J].计算机应用研究,2002,19(12):88-89.

    [2]张站.基于符号识别技术的选举计票系统研究[D].合肥:安徽大学,2011.

    [3]张婷,舒敬荣.基于图像识别技术的OMR在选举计票系统中的应用[J].传感器世界,2010,16(5):30-32.

    [4]昝丽红.选举计票系统设计分析[D].合肥:安徽大学,2014.

    [责任编辑:钟声贤]

    推荐访问:识别 通用 设计 系统 技术