| 【中文题名】 | 联机手写维吾尔文字识别技术的研究与实现 |
| 【英文题名】 | Research and Implementation of the On-line Uyghur Handwriting Recognition Technology |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-11-13 |
| 【中关键词】 | 维吾尔文,联机手写,识别,C-均值,分段线性分类, |
| 【英关键词】 | Uyghur,on-line writing,recognition,C-means,piecewise linear sorter, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>模式识别与装置 |
| 【论文摘要】 |
随着PDA、手机等便携式移动计算设备的普及,手写输入的应用越来越广泛。尽管汉、英文手写输入技术已经比较成熟,但维吾尔文字的联机手写识别产品尚未见报道。
本文首先介绍了联机文字识别技术的发展及汉、英文手写输入的主要技术,在此基础上对维吾尔文字手写输入的方案及实现技术进行了研究,主要做了以下工作:
(1)首先对维吾尔文字符与汉、英文字的结构特点进行了对比研究,提出了联机识别用维吾尔文字特征集,设计了以主体笔划方向、笔划数、点数、点位等为主要特征的特征码;
(2)通过手写板采集维吾尔文字符的坐标序列,进行滤波等预处理,按照维吾尔文字特征集及特征提取算法提取主要特征码,形成特征向量;
(3)建立特征模板库,对于每一类字符的样本采用动态聚类的C-均值算法划分子类,通过求均值向量计算各子类的代表点作为基准模板;
(4)采用分段线性分类器对输入的待分类样本与基准模板比较进行分类识别。
实验结果表明,本系统的识别方法是可行的,识别率大于90%。
联机手写维吾尔文字识别技术还处于实验阶段,本文仅对一种识别方法进行了一些探索性的研究,为进一步的研究提供参考。 |
| 【论文题纲】 |
|
摘要 |
2-3 |
|
Abstract |
3-4 |
|
目录 |
4-6 |
|
第1章 引言 |
6-8 |
|
第2章 联机识别技术简介 |
8-20 |
|
2.1 模板匹配技术 |
8-9 |
|
2.2 统计模式识别技术 |
9-11 |
|
2.3 结构模式识别技术 |
11-14 |
|
2.3.1 句法模式识别系统 |
12-13 |
|
2.3.2 统计法与结构法总结 |
13-14 |
|
2.4 模糊模式识别技术 |
14-16 |
|
2.5 人工神经网络 |
16-18 |
|
2.6 隐马尔可夫模型 |
18-20 |
|
第3章 维吾尔文特征研究 |
20-25 |
|
3.1 维吾尔文字介绍 |
20-21 |
|
3.2 维吾尔文字母结构特征 |
21-22 |
|
3.3 维吾尔文字母特征编码 |
22-25 |
|
第4章 联机手写维吾尔文字识别 |
25-47 |
|
4.1 维吾尔文手写联机识别的主要问题 |
25 |
|
4.2 识别系统 |
25-26 |
|
4.3 坐标采集 |
26 |
|
4.4 预处理 |
26-31 |
|
4.4.1 笔划识别前的噪声处理—原始坐标数据的滤波 |
26-27 |
|
4.4.2 书写的倾斜校正 |
27-29 |
|
4.4.3 规范化 |
29-31 |
|
4.5 特征提取 |
31-37 |
|
4.5.1 主体笔划方向码特征 |
31-33 |
|
4.5.2 笔划数特征码 |
33-34 |
|
4.5.3 点数特征码 |
34 |
|
4.5.4 基线与点标记位置关系码 |
34-35 |
|
4.5.5 点数为2时的特殊关系码 |
35-36 |
|
4.5.6 主体笔划始点与终点的x距离码和y距离码 |
36 |
|
4.5.7 附加部分旋转方向码 |
36-37 |
|
4.6 分段线性分类器 |
37-42 |
|
4.6.1 原理 |
37-38 |
|
4.6.2 确定代表点 |
38-41 |
|
4.6.3 学习并建立模板 |
41-42 |
|
4.7 实验系统 |
42-44 |
|
4.8 关于连笔识别问题 |
44-47 |
|
4.8.1 字符的切分 |
44-46 |
|
4.8.2 延迟笔划的处理 |
46-47 |
|
第5章 总结 |
47-48 |
|
参考文献 |
48-51 |
|
攻读硕士期间发表的论文 |
51-52 |
|
致谢 |
52-53 |
|
| 【DOI】 | LunWen.ID:2.2008.370614 |