首页 >  硕士论文 > 计算机硕士毕业论文 >   正文

面向客服聊天机器人的领域本体构建的计算机研究与应用

添加时间:2018-09-05 19:52:14   浏览:次   作者: www.dxlwwang.com
专业论文资料, 搜索论文发表论文代写论文网为你解忧愁!详情请咨询我们客服。
获取免费的论文资料? 欢迎您,提交你的论文要求,获取免费的帮助

本文是一篇计算机硕士毕业论文,计算机专业涵盖计算机科学与技术、计算机软件工程、计算机信息工程等专业,主要培养具有良好的科学素养,系统地、较好地掌握计算机科学与技术,包括计算机硬件和软件组成原理、计算机操作系统、计算机网络基础、算法与数据结构等,计算机的基本知识和基本技能与方法,能在科研部门、教育、企业、事业、行政管理部门等单位从事计算机教学、科学研究和计算机科学与技术学科的应用。(以上内容来自百度百科)今天为大家推荐一篇计算机硕士毕业论文,供大家参考。

 
第一章 绪论
 
研究背景及意义
科技和信息技术日新月异的进步带来了互联网的迅猛发展,同时给人们的购物方式带来了巨大的影响。线上购物逐渐取代了传统的购物方式,成为了人们的主流消费手段,越来越多的商家也开始设立网站提供在线交易的渠道。与此同时,为了满足客户购物时的与商户交流的需求,商户需要雇佣大量的客服工作人员。相比于组建电话客服中心、构建常见问题列表等方法应对客户的咨询,客服聊天机器人可以全天候在线,而且能使用自然语言以聊天的形式解决客户问题。如何构建合适的客服聊天机器人承担客服工作,自动答复客户的信息咨询成为了新的研究方向。聊天机器人旨在通过自然语言处理等技术,对客户的问题进行理解,通过检索知识库等方式产生对应的回复。它是一种模拟人类的对话模式,使用自然语言与人类进行交流的程序。客服聊天机器人相比人工客服有三个优势:一是提高客户感知,统一企业的线上客服服务模式,降低了解决客户问题复杂度;二是提升服务效率,延长服务时段,加快回复速度,缓解人工客服压力,节省服务成本;三是方便采集用户意图数据,为产品迭代优化的方向提供帮助。相比与普通的聊天机器人和问答系统,应用于客服领域的聊天机器人面对的客户问题绝大多数限定在具体客服负责的商务领域,构建领域本体来表示领域知识并应用于客服聊天机器人的语义理解以及答案构建中,对客服聊天机器人的回复准确度提升有一定的帮助。同时,硬件性能的提升和深度学习算法的应用也为客服聊天机器人的发展带来了新的方向。本体是概念和概念间关系以及概念实例的集合,将领域知识表达为本体的形式,能为知识的分享、复用和推理提供方便。使用本体组织领域知识并构建本体库,能够保存数据的语义信息,并且由于本体库结构化的特性,从本体库中抽取信息会更为简单、高效。目前有很多使用本体进行语义分析、检测和基于本体进行知识查询的应用,但这些应用主要使用人工构建的方法获得本体库,需要专业人员进行大量的工作,而且构建的本体库可移植性比较差。虽然目前也有一些自动或者半自动的本体构建方法,但基本上这些方法都有各自的缺陷,没有一套成熟稳定的本体自动构建方法。
..........
 
国内外研究现状
国外对英文聊天机器人的研究开始较早,1966 年世界上第一个聊天机器人ELIZA 诞生于麻省理工学院(MIT)。随着研究的进展,1988 年 UC[1]聊天机器人系统在加州伯克利分校诞生。UC 可以根据用户的问句提取简单的意图,它的出现推动了智能化聊天机器人研究的进程。受到 ELIZA 设计思路的启发,Richard SWallace博士在1995年开发了ALICE系统,其使用的AIML目前仍有广泛的应用。此外,还有用于电话信息查询的 YAP[2]、用于辅助学习的 CSIEC[3]等。总的来说,早年的聊天机器人研究主要集中在模版匹配上。近年来,互联网的飞速发展带来了用户对知识获取速度和便捷性的高度需求,这促进了研究者对聊天机器人系统的进一步研究。Benotti L[4]将聊天机器人用于高中教学,RohanKar[5]提出了一种物联网中的聊天机器人应用方法,AnbangXu[6]等设计了一个社交媒体中的服务性聊天机器人。随着国际上最具权威的文本检索会议 TREC 于 1999 年首次设置了有关问答系统的竞赛(TREC QA Track)。很多机构和大公司纷纷加入到问答系统的研究开发中,比较有名的如麻省理工学院(START系统)、微软(AskMSR 系统[7])、IBM(Waston 系统)、苹果(Siri)、谷歌(Google Now)等。START 系统的核心思路是使用知识标注和数据挖掘将结构化和半结构化的数据与自由格式的文本分开处理。AskMSR 问答系统认为返回错误的答案也比没有答案的效果要好,其将可能的答案进行置信度标注后返回给用户。Waston 系统采用的是构建知识库并根据问题选择答案的方式来回答问题的,它首先对输入的问题进行分析,根据分析的结果搜索知识库并对搜索结果进行处理并生成备选答案,之后使用计算上下文无关回答得分并进行软滤波的方式对答案进行评估,选取得分较高的回答。
..........
 
第二章 相关理论与技术
 
本章中涉及到的客服聊天机器人技术主要包括本体理论以及相关技术、自然语言处理技术和聊天机器人技术,以及论文中要使用的深度学习模型。
 
本体理论及相关技术
本体(Ontology)是一个由哲学领域引入的概念,其原始定义为“对世界上客观存在物的系统地描述,即存在论”。本体是对客观存在的事物的阐述,其目的是表达抽象的事物本质[22]。随着计算机科学的发展,人工智能领域引入了本体这一概念,最初 Neches 等人将计算机领域的本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”[23]。随着人们在信息系统、知识系统等领域中对本体的研究,本体的定义被不断地更新和完善。现在最著名并被引用得最为广泛的定义是由 Gruber 提出的,“本体是概念化的明确的规范说明”[24]。在使用构建语义网络的过程中,一般将本体形式化的定义为一个七元组O  (C  , AC , R,  AR,  H , I , X)[25],其中:C 表示概念类,即抽象事物的集合。AC 表示属性,属性是抽象事物具有的共有特性,属性的不同带来了概念类之间的差别。R 表示概念的关系,表示抽象事物同其他事物的联系。关系通常包含定义域和值域,定义域通常是一个概念,值域可以是字符串、数值或者概念。AR 表示关系的属性,关系属性是对关系限制,如对值域为数值型的关系,可以通过关系属性限制数值的范围。H 表示概念、属性和关系的层次。I 表示实例,即是与抽象事物对应的现实事物。X 表示公理。
.........
 
聊天机器人
聊天机器人(chatterbot)是一种模拟人类的语言模式,使用自然语言与人类进行对话交流的程序。这类程序能够分析用户的问题,组织自然语言答案,并针对问题给出合适的回答。聊天机器人程序通常运行在软件平台上,如网站、pc 平台或者手机、平板电脑等便携终端,不需要类人的承载设备。最早的聊天机器人 ELIZA 诞生于二十世纪六十年代[28]。MIT 的 JosephWeizenbaum 为了在临床治疗中使用软件模仿心理医生提供咨询开发了 ELIZA。ELIZA 只能接受文本形式的输入,并且它并不是对话的语义进行理解,而是通过正则匹配问句,使用预先定义的规则来构建回答的。如果问句的匹配结果符合规则,则根据规则改写匹配结果,并返回自然语言文本作为最终结果。ELIZA 并不具备复杂的知识系统,它只能正确处理心理学领域的聊天。尽管 ELIZA 具有种种限制,在其刚出现的时候,很多用户会把它与真人混淆。图 2-2 是一组 ELIZA 的人机对话例子。虽然 ELIZA 的知识规则简单,对话能力并不强,但是它使用的基于规则匹配的设计模式,为后续的聊天机器人的构建提供了方向。后来又有一些对话机器人出现,例如 Parry[29]、UC(UNIX Consultant)[30]等,他们均在 ELIZA 的基础上有所发展,比如尝试加入情绪模型、尝试分析用户语言并确定目标等。理查德·华勒斯博士在 1995 年设计并实现了基于模版匹配的聊天机器人ALICE[31]。其构建模版的 AIML(ArtificialIntelligenceMarkup Language)目前仍在基于模版匹配的聊天机器人有着广泛的应用。尽管 ALICE 采用的是仍然是源于ELIZA的对话策略,但是它在AIML的支持下性能处于同类型聊天机器人的前列。但是,这些聊天机器人的聊天能力与模板数量和质量紧密相关,并且其自身由于模版匹配的局限性,在长轮数对话中表现不佳。
........
 
第三章 基于同义词扩充的半自动客服领域本体构建.......... 20
引言..... 20
客服知识领域本体构建分析.......... 20
客服领域本体中概念类的构建...... 22
客服领域本体实例的爬取..... 26
客服领域本体实例的扩充..... 28
实验分析...... 35
第四章 基于客户意图约束及深度学习的多轮回答检索模型....... 39
引言..... 39
客服聊天机器人深度检索模型构建....... 39
基于本体的客户意图向量构建方法....... 45
实验分析...... 52
本章小结...... 55
第五章 客服聊天机器人系统的设计与实现........ 57
引言..... 57
系统总体设计....... 57
 
第五章 客服聊天机器人系统的设计与实现
 
引言
本章论文主要介绍客服聊天机器人系统的设计与实现,该系统能够结合构建好的本体库和人工客服问答历史记录训练的深度检索模型,根据用户的问题做出回复,并在确保回答正确的情况下尽可能提升回复语句的语义完整性和流畅度。在该客服聊天机器人系统中,首先通过对客户问题的语义理解获得使用本体表示的用户咨询意图,之后将该咨询意图应用于本体库查询推理生成相应回答和基于深度检索模型的中,获得查询推理得出的答案和从人工客服历史对话记录中检索得到的客服回答,根据检索回答的相似度选择返回给用户的答案。本章详细介绍了客服聊天机器人系统的体系结构和模块工作流程,其中主要介绍智能回复模块。系统的功能可以简述为客户在页面使用自然语言向客服聊天机器人咨询,由系统分析并自动做出自然语言回复。展示层:前端页面部分使用开源前端框架 bootstrap 和 jquery 实现,其中聊天UI 提供客户使用自然语言进行聊天咨询的界面,并且将聊天历史记录显示在界面上;数据处理层:本层包含问句分析、深度检索、本体查询推理和答案选择四个模块,其中,问句分析模块提供问句的分析处理功能,通过对问句的分词、句法分析和逻辑形式生成构建使用本体表示的客户咨询意图信息;本体查询推理模块将用户咨询意图信息转化为 SPARQL 语句的形式,并通过 Jena api 基于本体查询推理得到查询推理答案;深度检索模块根据训练好的模型,结合历史信息和用户咨询意图从备选知识库中选择与问题最匹配的人工客服的某一个回答作为检索答案;最后答案选择模块比较两个答案,选择其中的一个作为答案返回给客户。
\
.........
 
总结
 
随着互联网商务的快速发展,提供在线购物服务的商家越来越多,这也带来了大量的在线客服工作。通过客服聊天机器人代替人工客服成了越来越多商家的选择。如何提高客服聊天机器人的工作质量成为了商家热切关注的问题,本文在分析了客服领域知识的特点后选择构建领域本体库来结构化的存储客服聊天机器人需要的领域知识,并结合本体构建了基于客户意图约束及深度学习模型的客服聊天机器人系统,提升了聊天机器人的多轮对话能力。本文主要的工作如下:
(1)介绍了本体理论和相关技术以及自然语言处理中的分词、命名体识别和依存句法分析技术。同时介绍了客服聊天机器人相关技术以及自然语言处理中深度学习模型的应用。
(2)构建了客服领域本体库。本文结合客服领域知识的特点,设计了一个本体库半自动构建的方法。首先根据商户网站组织结构人工抽取本体的概念类以及概念类之间的关系,根据本体概念类针对性地设计爬虫爬去商户网站中实例的标准表达,最后借助同义词扩充方法在人工客服历史记录中获取实例的同义表达并加入本体库,增加本体库对领域知识的覆盖率。在这个过程中,本文针对传统的同义词扩充方法因为词向量构建效果不好造成的同义词结果精准度不高,需要大量的人工筛选工作的问题,设计了基于词相关本体相似度的改进实例同义词扩充算法,通过计算词相关本体相似度筛选可能的同义词,提升了实例同义词判断的准确率,节省了人工筛选的工作量。
(3)构建了基于客户意图约束及深度学习的多轮回复检索模型。本文首先构建了一个基于长短时记忆机的深度检索模型,模型有句子编码器和上下文编码器组成,使用人工客服历史记录训练。针对深度检索模型在多轮对话中容易给出偏离客户咨询意图的问题,本文使用了客户咨询意图本体信息构建意图向量作为上下文编码器的一个输入来约束深度检索模型。本文使用基于自然语言处理手段对客户问题进行句法分析,使用本体表示客户咨询意图,并通过更新意图网络的方法获得客户在每个提问时刻的意图信息。经过实验验证,改进的客户意图约束深度检索模型在多轮对话中选择回复的能力得到了提升。
(4)设计并实现了客服聊天机器人系统。本文结合本体库查询推理和深度检索模型实现了客服聊天机器人系统。经过测试验证,系统能够在与客户的聊天中达到预期效果。
..........
参考文献(略)

提供海量毕业论文,论文格式,论文格式范文,留学生论文,商务报告相关资料检索服务。
本论文由代写论文网整理提供 http://www.dxlwwang.com/
需要专业的学术论文资料,请联系我们客服
本文地址:http://www.dxlwwang.com/jsj/6808.html
论文关键字:计算机硕士毕业论文 深度学习