1. 研究目的与意义
随着移动互联网、大数据与人工智能的迅猛发展,信息与数据如飓风般覆盖了地球上的每一个角落,用户为了得到自己想要的数据,往往采用信息检索(百度,谷歌搜索)。近几年来,随着机器学习的快速发展,利用问答系统获得用户想要的信息成为了各大互联网公司的主攻方向,全领域的问答系统已经成为了自然语言处理研究的主要任务之一,并取得了许多成果(微软的小娜,苹果的Siri)。
对于知识库问答和社区问答任务来说,它们的系统是基于检索技术实现的,其局限性在于过分依赖于外部知识资源,并且所能解决的大部分是常识性问题。而基于机器学习的问答系统可以在外部知识受限的情况下,通过文本的语义理解完成基于给定相关文档的答案推理,所能解决的问题类型更加多样。从本质上讲,机器阅读理解系统解决问题的方式更加近似于人类认知问题的方式,需要机器进行在线的知识学习,该项技术的研究与发展对于促进机器的学习与认知能力具有深远意义。同时,通过进一步研究语义解析方法及深度学习方法来提高问答效率是值得研究的重要问题。
2. 研究内容和预期目标
本研究要构建一个智能的文本挖掘模型。模型可以起到辅助阅读的作用,帮助人们显著提高阅读的效率。具体到使用情景上,对于用户输入的问题与文档,模型可以定位到文档中能帮我们回答问题的所在行,或者直接给出明确的某个词作为答案输出。
本次研究拟解决的三个关键问题包括:
1、如何根据文本检索到正确的知识?
3. 国内外研究现状
国外研究现状
对于机器阅读理解系统中文本相似度比较的主要研究方法可以归纳为两类:(1)基于传统特征工程的方法;(2)基于深度学习的方法。
(1)基于传统特征工程的方法。早期的研究主要针对垂直领域的小型知识库,使用的方法大多为传统的基于符号表示的语义解析方法。
4. 计划与进度安排
2022.12.01---2022.01.08 确定研究课题,总结参考文献,撰写开题报告
2022.01.09---2022.02.27 了解问答系统的实现技术,功能及特点,确定特定现系统要完成的主要功能,进行系统的分析,设计及相应的实现,测试及调试工作。完成论文提纲。
2022.02.28---2022.04.18 进行毕业实习,完成论文初稿
5. 参考文献
[1]陈康,樊孝忠,刘杰,等.受限领域问答系统的中文问句分析研究田.计算机工程2008,34(10):25-27.[2]高程.聊天机器人“小黄鸡”的语用原则和话语策略分析闭.语文学刊:基础封盲版 2013(5):30-31.[3]郑实福,刘挺,秦兵,等.自动问答综述[J].中文信息学报,2002,16(6):47-53.[4]李明鑫. 基于信息抽取的实体知识库系统研究[D]. 北京交通大学, 2017.
[5]杨思春,高超,秦锋,等. 融合基本特征和词袋绑定特征的问句特征模型[J]. 中文信息学报, 2012, 26(5):46-52
[6]李欢. 问答系统中的文本信息抽取研究与应用[D].中国科学技术大学,2009
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。