1. 研究目的与意义
增强机器的模式识别能力一直是计算机科学家努力的方向,对模式识别的研究和分析,也正是理解人类智能本质的重要途径。手写数字的识别是模式识别以及机器学习领域的一个重要应用。基于KNN算法的手写数字识别是基于相似度的文本分类方法,通过训练得到一个KNN分类模型,再进行手写数字的识别。
随着人工智能技术的快速发展,手写数字识别技术在数据收集、实现人工智能对数据的筛选等方面具有一定的实用性。现实生活中也仍有大量的手写数字单据需要录入计算机进行管理,比如物流行业中的手写快递单据、银行业的手写支票和汇款的等。完善的手写数字的识别技术可以提高数据管理的效率,在一定程度上推动机器智能化发展。2. 研究内容和预期目标
(1)首先手写数字识别在模式识别技术中的必要性,论述手写数字识别的意义;
(2)收集数据,研究手写识别的预处理技术。包括图像转化为测试向量、二值化、行字切分、平滑等研究。
(3)对数字识别进行综合研究。主要论述基于KNN算法的手写数字识别,对涉及其中的不同预处理结果、不同匹配距离准则等进行详细叙述,找寻合适的数据处理方式以及k值;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 国内外研究现状
阿拉伯数字作为全球通用的数字语言,与各个国家、名族和文化背景均无关,是世界上统一使用的符号,在人工智能识别方面具有极大的研究意义和应用前景。
其相关技术在实际生活中比较突出的应用成果有击败李世石的ALPHAGO以及之后的ALPHA GO ZERO等。数字识别的方法有MRFSE、SVM等,这些方法在识别之前,需要对样本图像进行统一的预处理,如二值化、归一化、平滑去噪、笔画细化、特征提取等,再加上训练等操作以实现数字识别。但在实验过程中,大量时间表明,没有一种方法可以获得各种字符特征100%的识别率,每个研究方法都存在局限性,还需要进一步对识别过程中的干扰因素分析和研究。4. 计划与进度安排
论文设计之初花半个月到一个月的时间梳理相关文献,整理总结相关理论知识,搭建实验设计需要的理论框架;接着进行实验数据采集及相关的预处理分析,收集整理出适用面广、处理结果理想的数据集。
论文设计的重点是基于选定的KNN算法思想搭建算法流程,选取合理的标准计算数据集中点与当前点之间的距离,综合分析预测分类的结果,选择合适的k值。完成算法设计后,在KNN算法的基础之上分析解决处理大量数据集是的存储和耗时问题,研究优化方案。最后在实验基础之上结合实际应用进行分析总结。论文撰写进度紧跟实验进度。5. 参考文献
[1]潘登.KNN算法的相似度研究[D].长春:东北师范大学,2013.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。