首页 >  硕士论文 > 计算机硕士毕业论文 >   正文

基于社交网络个体行为特征的信息推荐算法研究

添加时间:2018-08-02 20:37:52   浏览:次   作者: www.dxlwwang.com
专业论文资料, 搜索论文发表论文代写论文网为你解忧愁!详情请咨询我们客服。
获取免费的论文资料? 欢迎您,提交你的论文要求,获取免费的帮助

本文是一篇计算机硕士毕业论文,计算工具的演化经历了由简单到复杂、从低级到高级的不同阶段,例如从“结绳记事”中的绳结到算筹、算盘计算尺、机械计算机等。它们在不同的历史时期发挥了各自的历史作用,同时也启发了现代电子计算机的研制思想。(以上内容来自百度百科)今天为大家推荐一篇计算机硕士毕业论文,供大家参考。

 
第一章 绪论
 
1.1研究工作的背景与意义
互联网的发展迎来了大数据时代[1, 2],信息出现爆发式增长。例如,新浪微博每天有2亿多的动态更新[3];中国第一的C2C平台淘宝网上有5亿注册用户数,他们可选择的在线商品数了超过8亿[4]。如此庞大的数据体量带来了信息过载的问题[5]。互联网的发展具有两面性。一方面,人们受益于空前丰富的信息资源和获取渠道,享受着互联网给生活带来的便利;另一方面,从海量的数据已对个人寻找有用信息造成了困扰。个人已经无法从如此庞大的数据中进行筛选过滤。人们对解决信息过载(Information Overload)的问题的需求特别迫切[6]。不仅仅是个人用户面临着信息过载问题,作为物品提供方的企业也面临着信息过载的困扰。如何准确地顺应顾客的需求,提供精准的服务和商品是现在企业脱颖而出的关键。为解决信息过载的问题,出现了两种技术,搜索引擎和推荐系统。搜索引擎是一种对互联网资源整理分类,并存储在数据库中供用户检索的系统。推荐系统是一种采集用户的历史信息,并根据用户特征预测用户潜在需求的系统。两者的区别在于,搜索引擎是被动式的信息过滤技术,满足用户显式表达的兴趣[7],推荐系统是主动式的信息过滤技术,满足用户未显式表达的兴趣[8]。在用户需求不明确的情况下,推荐系统是用户最需要的工具。推荐系统定义为:向用户建议有用物品的软件工具和技术[8]。作为一种解决信息过载问题的有效工具,推荐系统对每个用户的需求表达,都根据用户自身的特征,收集用户信息到自定义数据库。这些用户信息包括用户交易信息、物品信息和其他的信息等。推荐系统通过分析这些用户信息,根据不同的推荐算法向用户推荐内容。推荐的内容因用户个体之间的差异呈现出个性化,符合个体的实际需求。用户对推荐的内容,可以选择接受也可以选择不接受。用户的这些行为反馈给推荐系统,更新用户在数据库里的记录,并用于下一次对用户的推荐。推荐系统已经在多个领域获得应用,并创造了极大的应用价值。例如,Google为用户定制个性化广告;Amazon平台为用户推荐相似图书的清单[9];今日头条根据用户偏好推荐新闻资讯等。
.........
 
1.2国内外研究现状
推荐系统的研究经过几十年的发展,吸引了不同学科不同领域的研究者,不断涌现出新的学术成果,慢慢形成了好几个流派。根据本文研究的内容,给出此方向上的国内外的主要研究成果。
 
1.2.1协同过滤推荐系统
协同过滤(Collaborative Filtering,CF)推荐系统是使用协同过滤算法为主要技术的推荐系统,在使用集体智慧的基础上,基于大众行为数据做出决策推荐。自从Resnick等人[26]提出的协同过滤算法被用于新闻过滤系统GroupLens上,协同过滤算法就一直是推荐算法研究的热点。协同过滤算法对用户和物品之间的交互信息建模并为用户提供个性化的推荐服务。自Netflix Prize大赛举行以来,协同过滤算法在学术界和工业界已经得到了广泛的研究。常见的如最近邻的协同过滤方法(简称KNN,包括基于用户最近邻[27]和基于物品的最近邻的方法[28])、隐因子模型[29]、聚类技术和决策树方法[30]等等。基于用户最近邻的算法[27]思想是通过对用户的历史数据(如评分、购买、收藏和浏览等),找到与用户有相似品味的其他用户,将品味相似的其他用户所喜欢的物品推荐给用户。用通俗的话理解就是“人以群分”。基于项目最近邻的算法[28]认为一个用户选择不同的物品,通常认为物品之间存在着某种关联,通过对不同的用户进行累积,得到物品之间的相似度,并将与用户过去感兴趣的物品相类似的物品推荐给用户。通俗理解为“物以类聚”。协同过滤算的举例参考图1–1。一般来说,基于项目最近邻的方法在准确性上比基于用户最近邻的方法更高,并且适用范围更广[9]。对协同过滤系统的研究还有很多,如Das等人[31]将矩阵降维技术应用于推荐系统中。Salakhutdinov等人[32]在推荐系统中引入了玻尔兹曼机器学习方法,结合SVD算法提高推荐准确性。相比于以前推荐算法使用的显式反馈信息(如用户的评分等),Koren考虑了用户的隐式反馈信息(如浏览、点击等),认为这在一定程度上反映了用户的偏好[33]。
...........
 
第二章 推荐系统基础简介
 
互联网的快速发展给人类社会带来了非常大的影响,也极大地改变了人们的生活方式,很多社会活动从线下转移到线上。比如以前只能去影院等地方观赏电影,而现在在线就可以观看大部分电影。以前的资料内容只能通过纸质记载传播,而现在线上提供各种存储、传播、查看的服务。以前购买物品要去商城超市,而现在足不出户就可以买够绝大部分生活所需的物品。由于互联网的庞大的体量,在给人的资源获取带来了很大便利的同时,也带来了信息过载的困扰。例如Netflix上有成千上万的影视作品,Amazon上有百万本书籍可供选择,Delicious上更有无数的网页在个人最喜欢的清单上。很显然,人的精力是有限的,要从这么巨大的信息中选择自己想要的信息非常困难。并且人与人之间的差异性导致每的需求也不一样,每个用户都需要更加个性化的服务。因此我们需要一有用些方法和技术来帮我们处理这些问题。于是推荐系统应运而生,它通过分析用户历史的数据,可以帮助用户找到潜在感兴趣的信息。不同的平台和推荐算法为用户制定了更加个性化的服务需求。推荐系统在现代生活中用途广泛,已经在多个领域里做出了极大贡献。同时推荐系统被来自计算机、经济、物理等不同领域的专家学者们广泛关注,产生了大量的研究成果。本章节将介绍推荐系统的应用以及面临的挑战、推荐算法的分类、推荐系统常用的评价指标和数据集。
 
2.1推荐系统应用
电子商务应用。推荐系统的诞生对电子商务来说是一个巨大的福音,它包含的理念是为服务对象提供适合的物品,同时还隐藏了另一个理念是为物品找到适合的服务对象。这两个理念极其符合电子商务的发展。因此推荐系统在电商的发展中起到了巨大的作用。电子商务也是最成功的应用推荐技术的代表[74]。对电子商务公司来说,为客户提供准确多样的商品可以极大提高客户的购买力和粘性,并且将大量的处于长尾态的商品推荐给用户,提高了冷门物品的出售率。更进一步的,对每个客户展示与客户需求关系密切的商品或者促销活动,从而增加商品的曝光率和购买率。对客户来说,难以从如此庞大的体量中发现自己想要的商品,而推荐系统恰好解决了燃眉之需,对彼此都是一个双赢的结果。最开始应用这项技术的是Amazon。Amazon在推荐技术的应用上不仅起步最早,而且到现在也受惠于这项技术。其他的电子商务公司如京东、淘宝等也纷纷使用了推荐技术。当客户进入电子商务网站时,推荐系统通过对客户已有的浏览、关注、购买等行为建模,预测客户的需求并推荐给客户可能需要的商品。具体每个电子商务网站的推荐算法有很大差别。如在Amazon网站上,当用户将某个商品添加进购物车后,会向该用户推荐浏览过这个商品的其他用户所选择的商品。这是一种基于用户的协同过滤算法[27]的思想。当结束这一次活动,再次登录Amazon网站时,推荐系统会根据当前用户已经购买或者已经浏览的商品记录,向客户推荐与这些商品相关联的其他商品,此时运用的是基于物品的协同过滤算法[75]和关联规则算法的思想。淘宝和京东都为客户提供了对已经购买过的商品进行打分的功能,通过评分反映客户对商品的满意程度。
............
 
2.2推荐系统面临的挑战
推荐系统发展至今已有几十年的时间,吸引了学术界众多研究者的关注并产生了许多研究成果,同时推荐系统也是学术和实践共同发展相辅相成的典范,已有众多实际的运用,详见2.1节。但是目前推荐系统也存在众多的问题,面临严峻的挑战。多样性与精确性的两难问题。推荐系统推荐用户喜欢的物品,一个原则是准确。想要推荐用户喜欢的物品,最简单保险的方式是推荐特别流行的物品,用户有很大概率都会喜欢。但是这样做导致用户的体验变差。现在线上线下都有众多的渠道去获取信息,尤其是流行物品,用户很有可能已经知晓或者选择过这些物品。这样的推荐与用户的个性化需求相悖。从实际应用角度来说,系统因为用户选择的物品过于流行,而大部分小众的物品难以出现在用户面前,对收益不利。另一方面,发掘冷门的物品给用户,使用户产生惊喜的感觉,可提高用户对推荐系统的信任和粘性。研究已经表明,过度追求精确性会导致用户获得有用的信息变少,并且可选择的面越来越狭窄[16]。因此顺应平台和用户两者的需求,多样性是一个必然的趋势。但是准确性和多样性之间存在着矛盾。对用户而言,如果推荐的物品过于小众但是符合自己偏好的物品变少,会对推荐系统产生怀疑。而商家也因此减少了收益。对这个两难的问题,很多时候只能二选一,注重准确性牺牲多样性或者注重多样性牺牲准确性。对多样性与精确性的两难问题,目前一种可行的思路是处理用户的推荐列表[15, 25],提高列表内容的多样性。另一种可行的思路是利用社交网络做为辅助信息,对推荐算法进行增强。研究表明,相比起推荐系统,用户更加信赖来自朋友的推荐[60],通过分析社交关系,可以提高网购物品的推荐准确度[87]。所以对于社交关系如何运用于推荐系统[88],提高推荐算法的性能,同时也建立更好的机制促进社交网络的推荐[89, 90],这些都是推荐系统需要考虑的问题。第四章将研究信任关系如何提高推荐算法的性能。
..........
 
第三章基于节点相似性的推荐算法研究.........30
3.1引言..........30
3.2符号和数据....31
3.3评价指标......32
3.4基于节点相似性的算法设计.............33
3.5实验结果......37
3.6本章小结......41
第四章基于信任增强推荐算法研究.............42
4.1引言..........42
4.2信用增强相似性的推荐算法.............43
4.3基于信任关系的资源分配推荐算法.......56
4.4本章小结......65
第五章基于社会化标签的推荐算法研究.........67
5.1基于引力模型的推荐算法...............67
5.2对推荐算法的辅助研究.....76
5.3本章小结......91
 
第五章 基于社会化标签的推荐算法研究
 
现实中推荐系统的应用非常广,尤其是在电子商务和社交网络中。这部分推荐系统的结构并不仅限于二部图网络。有些系统平台赋予使用者发表和编辑内容的权利,这些可分享的元数据是用户自由产生的关键字,被称之为标签。标签的出现给系统平台提供了额外的分类方式并且对更深刻地了解了用户需求。标签也给在线的用户提供了表达自己观点的机会,让他们在找寻志同道合的人和物上节约了时间精力。这类的网络平台有Delicious、豆瓣等。标签与推荐系统的结合对解决推荐系统面临的冷启动问题有很大帮助。本章提出了基于引力模型的推荐算法,通过用户对标签的使用情况预测用户的偏好。为了对进一步改进推荐算法提供帮助,需要对标签推荐系统有更深刻的理解。本章从网络演化的角度分析了标签网络的特征。考虑到标签是用户自定义的,用户之间的的差异导致对标签的理解和使用方式不同。自定义标签产生了大量的内容,降低了内容检索和信息分享的能力。因此考虑由推荐系统推广部分标签,降低推荐系统中的信息熵。标签的推广过程,可以描述为一种信息传播[195]的过程。从信息传播的方向研究影响用户对信息采纳的关键因素,根据研究结果指导推荐算法的研究。
 
5.1基于引力模型的推荐算法
随着电子化设备更加廉价易得、通信设施更加完善和互联网本身的开放性,在更加自由开放民主的Web2.0时代,网络已经是生活中密不可分的一部分。面对网络速发展带来的信息过载问题,传统的二部图推荐系统已经无法满足人的交互需求。物品的种类越来越多、分类越来越细以及人的选择面的扩大,使得单纯通过偏好相似的用户推荐所起的作用越来越有限。另外刚刚进入系统的新用户,在系统中没有足够的多的行为数据,在以行为相似性为算法导向的推荐系统中,没有足够数据导致对用户的行为特征的计算不准确,导致产生了不合理的推荐。这是典型的推荐系统的冷启动问题。同时刚刚进入推荐系统的物品也会遇见同样的冷启动困境。很多不同的推荐系统平台通过增加一些社会化信息提高人对物品的信息的掌握,提高推荐系统对人的偏好的掌握,以提供更加准确的服务。标签的出现是一个契机。在社会化标签系统里,人被赋予了重要的角色。不仅可以选择物品,还可以对物品进行分类和描述。通过对系统里的内容进行打标签,对不同的物品提供个性化标注,方便用户分类查找。同时对现有物品提供更多描述,为其他用户提供方便,降低用户沟通、分享和获取的成本。标签代表着用户的最直观的偏好的内容和分类,也为推荐系统提供了更多个人特质数据。例如对同样的一部电影《红海行动》,有的用户对此标注“战争”、“爱国”等,有的用户标注“杜江”、“林超贤”等。这些标签反映出用户对内容和分类上的偏好。
\
..........
 
总结
 
计算机和互联网的创造发展是彻底改变了人们的生活方式,人们对线上和线下结合的生活方式越来越适用,带来的问题之一是信息过载。为解决这个问题,人们提提出了推荐系统并为此进行了几十年的研究。推荐系统在生活中已经不可缺少,帮助用户解决信息过载的难题,从繁杂冗余的信息中寻找用户感兴趣的信息,节约用户的时间和精力。另一方面,推荐系统也为系统本身提供了良好的展示渠道,从众多信息物品中寻找到有用的信息推荐到用户面前。推荐系统如此重要,对此的研究一直是科研的热点。但是目前推荐系统仍然面临这一些难题和挑战。本论文从以下几个方面对此进行了研究:
(1)针对多样性与精确性的两难问题,本论文第三章从混合算法的角度,分析余弦相似度和资源分配相似度的优缺点。结果显示,基于余弦相似性的协同过滤推荐算法的准确性高,但多样性较差;基于资源分配相似性的物质扩散推荐算法的多样性好,但准确性不足。通过结合余弦相似度和资源分配相似度,提出全新的CosRA相似度指标,并在物质扩散的推荐系统系统框架下,提出了一种基于CosRA指标的推荐算法。在真实数据集上的实验结果显示,基于CosRA指标的推荐算法表现出更好的推荐结果准确性、多样性和新颖性。所提出的CosRA指标没有参数依赖,非常适合作为一个普适的相似性度量方法,应用于推荐系统。将CosRA指标推广得到一般化的CosRA指标不能显著提升推荐算法效果,这表明CosRA指标已经是最优形式。
(2)在第三章的CosRA相似度算法的基础上,本论文第四章充分利用推荐系统中已存在的社交关系网络,提出CosRA+T算法,并用参数对受信任用户的获得资源进行扩大和缩小。有意思的是,本实验找到了可调参数的最优值以获得最佳的推荐准确性。同时在不同的数据集之间进行实验的其他评价指标也显示该参数最优。实验表明,适当地将受信任用户的资源进行扩大,能有效提高推荐算法的性能。在两个真实的数据集Epinions和FriendFeed上,全面测试了CosRA+T方法的性能,并与其他五个基础推荐算法进行比较,结果显示CosRA+T方法确实能提供一个高准确性、丰富多样性和新颖性的推荐列表。本论文第四章还在物质扩散(MD)算法和热传导(HC)算法的混合算法(HA)的基础上,充分利用信任网络,提出一种新的信任增强算法THA算法。对受信任的用户赋予更多的资源值,增加受信任用户在物品推荐上的影响力。
..........
参考文献(略)

提供海量毕业论文,论文格式,论文格式范文,留学生论文,商务报告相关资料检索服务。
本论文由代写论文网整理提供 http://www.dxlwwang.com/
需要专业的学术论文资料,请联系我们客服
本文地址:http://www.dxlwwang.com/jsj/6778.html
论文关键字:计算机硕士毕业论文 信息传播 用户信任