手写识别建模数学方法

点赞:25369 浏览:118411 近期更新时间:2024-03-11 作者:网友分享原创网站原创

摘 要:为了解决汉字手写识别,提出最简单的建模方法.运用独特思路,建立了拓扑学的二维图形定义的模型.在网格背景中,使用二十七种点的相互的拓扑关系定义,识别汉字基本笔画的六种分类,然后识别了汉字的每种单一连续的手写笔画,从而识别了汉字.规避了常见的二维图形学中的复杂的线条计算与判定.从而,使得手写识别变得十分轻松,而且机理简单、清晰、易懂,使得编程工作量降低到最低点.本文的方法,具有通用性,可以机动灵活的移植到其它任何民族的文字.


关键字:汉字手写识别;英文手写识别;联机识别;连笔识别;手写识别

中图分类号:TP391文献标识码:ADOI:10.3969/j.issn.1003-6970.2013.08.005

本文著录格式:[1]黄弋石,梁艳.手写识别建模数学方法研究[J].软件,2013,34(8):13-15

0引言

我们成功的解决了汉字与英文手写识别的建模.[1-7]本文,将最有特色得到数学算法加以公布.在国内一定是首创,在国内外还没有查到类似报道.

识别算法,在常见的网格背景中运算.点阵大小为WIDTH×HEIGTH等于80×80.因为网格的精度很低,手写笔的触点精度与之对应,因此,不存在笔画细化的难题.所以我们不使用高分辨率的图形处理惯例,而只用低分辨率对应的数学算法.

网格背景使得汉字可以依照二值数字点阵来描述,其中,“1”表示笔画,“0”表示空白背景.这个方法极其巧妙,甚至不需要高深的数学才能与复杂的数学公式,就可以轻松的解决手写笔算法问题.从工作量上计算,也是极其少量的.

1中英文字的基本定义

手写识别建模数学方法参考属性评定
有关论文范文主题研究: 关于中国科技的论文范文资料 大学生适用: 大学毕业论文、电大毕业论文
相关参考文献下载数量: 47 写作解决问题: 学术论文怎么写
毕业论文开题报告: 标准论文格式、论文目录 职称论文适用: 期刊目录、职称评中级
所属大学生专业类别: 学术论文怎么写 论文题目推荐度: 优质选题

这里从我们对中英文手写识别研究中挑出,一组有代表性的基本定义,[1][2]来演示本文算法.我们的算法,只要能区分这一组定义,就可以理解,它也能适用于其它文字中的类似的基本定义.可以推理得到,它是有效的适合任何手写识别的基本算法,比如藏文等中国少数民族文字.

(1)竖、横与斜.手写的竖与横,都有一定的摇摆幅度.斜介于竖横之间.

(2)角与圆角.接近与V与U,在手写特征下的区别是有拐点与无拐点.

(3)圈与近圈.也就是,封闭的圆与接近封闭的圆.这个定义在楷书中用不上,只适用行书、草书以及下文所提的连笔识别.

(4)短划与点.与竖与横的区别是方向性不强,在方格中,通过边比特征可以区分.

(5)交叉与连续.交叉,是指基本定义的笔画相交叉,分T型交叉,和X型交叉,也可简化为一种交叉.连续,是指,基本定义的笔画从起点到终点(或笔画的两端)是连续的且无分叉,可平滑,也可转折.

(6)相对位置与方向.基本定义的字元之间的关系,有上、下、左、右、上左、上右、下左、下右.比如一个斜线可以分为,左斜、右斜、下斜、上斜、(左上斜、左下斜、右上斜、右下斜).

2算法的定义

使用穷举法,在九方格中列出一个点与周围点的二十七种拓扑逻辑关系,算法见图1到图7.然后使用这二十七种拓扑关系,去描述并识别上面的那组基本定义,就可以轻松识别手写汉字.

3算法应用例举

我们从研究挑出楷书系列拆解分类,字就是由该组单位构成.如图8.[1][2]这样,可以来对算法做一演示.我们成功的用本文算法区分笔画.显然,用来区分笔画时使用的数学方法非常简单,没有任何复杂的公式.

4算法的广泛使用性

我们,通过研究,归纳得到32到87个特异结构,来描述行书.这些特异结构都互为独立.[1][2]这里列出其中的部分笔画,见图9.我们利用本文算法,同样能够解决问题.草书的定义与分类类似于英文在线连笔识别的方法,也可以顺利解决.

5结论

我们成功的解决了中英手写识别,可以预见,这一套理论可以轻易的移植到别的任何一个文字.本法绕开了传统数学中的线条的常规概念.使用最简单的拓扑几何学方法,系统化的建模应用,解决了复杂的二维计算机图形学的难题.这套建模方法的意义,是,对所有种类的手写文字可以机动灵活的移植,将复杂的手写识别,简化到使用最简单的数学语言描述.希望广大同仁,广泛应用于各种民族的手写文字识别之中.