首页 >  硕士论文 > 计算机硕士毕业论文 >   正文

基于文本集常见词的无载体计算机信息隐藏技术研究

添加时间:2018-06-17 18:54:30   浏览:次   作者: www.dxlwwang.com
专业论文资料, 搜索论文发表论文代写论文网为你解忧愁!详情请咨询我们客服。
获取免费的论文资料? 欢迎您,提交你的论文要求,获取免费的帮助

本文是一篇计算机硕士毕业论文,计算机硕士毕业论文摘要中应排除本学科领域已成为常识的内容;切忌把应在引言中出现的内容写入摘要;一般也不要对论文内容作诠释和评论(尤其是自我评价)。(以上内容来自百度百科)今天为大家推荐一篇计算机硕士毕业论文,供大家参考。

 
第1章绪论
 
近年来,随着多媒体技术的迅猛发展与互联网的快速、广泛普及,数字化、网络化使人的生存方式发生了巨大的变化。正如美国著名学者尼古拉斯·尼葛洛庞帝在其《数字化生存》一书中描述的那样,我们现在生活在一个几乎完全数字化的世界中,大家运用数字信息技术与互联网进行工作与学习、消费与娱乐、出行与互动、购物与支付等活动[1]。电子文本、数字图像、数字电视与电影、动漫与网络游戏等数字多媒体内容正广泛渗透到工业、金融、教育、娱乐等领域,影响着我们生活的方方面面。但因数字多媒体内容的数字特性,使得其极易篡改、非法复制与传播,进而引发相关法律纠纷。如:近年来,网络小说被指涉嫌抄袭的情况屡屡成为社会热点话题;与此同时,随着各种图像处理软件与修图工具的快速发展与日益普及,普通民众利用这些软件与工具也可较容易地对数字图像内容进行修改,达到“以假乱真、扰乱视听”的目的;[2]等等。于上世纪90年代逐渐兴起的,交叉信息论、密码学、概率论、自然语言处理、机器学习等多个学科,信息安全研究领域的重要分支——信息隐藏技术,为这些问题的解决提供了一条新途径[3],引起了国内外学术界的关注与重视。信息隐藏技术就是通过某种方法把秘密信息隐藏于公开信息之中,而不影响公开信息的正常传播与使用。信息隐藏的重要特点是它不仅隐藏了秘密信息的内容,而且秘密信息的存在也是不可感知的[4]。版本序列号、公司LOGO、作者信息等秘密信息都可以隐藏到数字作品中,从而可以用来确定版权归属、跟踪侵权等[4]。信息隐藏技术也可应用于秘密通信等军事安全领域,通过隐藏了秘密信息的公开信息的传递来完成秘密信息的传输。本章着重介绍了研究课题的来源,研究的背景、目的与意义,论文的主要研究工作及论文的行文结构。
 
1.1选题来源
本选题来源于国家973前期研究专项《数字媒体取证研究》(编号:2010CB334706)、国家信息安全专项《OOXML文档信息隐藏及JPEG图像隐藏信息检测技术研究》(编号:P2010004EA)以及国家自然科学基金重大项目《文本内容安全研究》(编号:60736016)与《基于文本大数据的无载体信息隐藏研究》(编号:U1536206)。
.........
 
1.2 研究背景
信息隐藏是一门古老而又年轻的科学,它的思想最早起源于公元前 440 年古希腊的隐写术。传说有一个人把秘密信息剌在奴隶的光头上,等奴隶头发长出来后,通过奴隶把秘密信息传递到需要的另一个人处,从而实现两人间的秘密通信。信息隐藏技术自古以来就一直被人们所使用[3],广泛应用于军事中的秘密通信、情报收集及泄密者查询等信息安全领域,如古代的藏头诗与近代间谍使用隐形墨水书写等等。在我国古代,有一种有趣的、基于语义的信息隐藏方法——通信的双方各自拥有一个完全相同的带有小孔的纸,发送者把秘密信息写在纸上小孔的位置,再在其他位置填写上合适的字以形成一段看似合理的话,而后把这段话传递出去;接收者收到后,用同样的纸覆盖上去,就可以读出隐藏其中的秘密信息。16世纪,Carden(1501-1576)对这种思想进行了改进,设计了Carden’s Grille(卡达尔诺栅格)[5, 6]。图1.1给出了一个包含秘密信息的卡达尔诺栅格。上个世纪 80 年代,英国发生了一起内阁文件泄密事件:1981 年,英国的一家报纸刊登了内阁会议的秘密文件图片,引起轩然大波;但英国首相玛格丽特·撒切尔夫人事先对分发给每位部长的文件进行了信息处理,每份文件的字间距都不相同,以对应不同文件接收人的身份信息;很快,政府部门用这种方法查出了泄密者[7]。这是基于文本内容格式(字间距)的信息隐藏方法的应用实例。上个世纪 90 年代以来,随着互联网的日益普及与多媒体技术的快速发展,在网络上传播的数字文本、数字图像、数字音视频等多媒体数字作品日趋泛滥,受益于数字作品版权保护、完整性控制、军事上的安全通信等应用需求的大力驱动,信息隐藏技术发展迅猛[8]。1996 年,在英国剑桥大学召开了第一届国际信息隐藏学术会议,这个会议的召开标志着信息隐藏这个交叉学科的正式诞生[9],引起国际学术界的密切关注与强烈反响,研究者覆盖了政府部门、知名企业、大学与研究所等相关研究机构。现今,除国际信息隐藏大会以外,还有国际多媒体安全会议(ACM MM&Sec - ACMMultimedia and Security Workshop)、数字水印国际学术会议(International Workshopof Digital Watermarking - IWDW)等多个专业会议也开设了信息隐藏专题,吸引了越来越的研究者加入到信息隐藏技术研究中来。这些年发表的、信息隐藏相关的 SCI 论文数量(如图 1.3 所示)的逐年递增也说明了这点。
.........
 
第 2 章 文本信息隐藏相关技术介绍
 
信息隐藏技术,又被称为隐写技术,是一种秘密通信方式。通信双方采用这种秘密通信方式,可利用在公共信道中传输的公开信息来传递秘密信息而不会引起窃听者的怀疑与破坏。信息隐藏技术按照不同的分类标准,可以分为不同的类别。如果按隐藏的载体类型分类,可以主要分为文本信息隐藏方法、图像信息隐藏方法、音频信息隐藏方法与视频信息隐藏方法等。但这些信息隐藏方法有一个共同的缺点,就是:只要在载体中嵌入了秘密信息,攻击者就有可能通过分析载体信息统计特征的变化,从而知道载体中秘密信息的存在就可以进行破坏,甚至获得载体中嵌入的秘密信息。而载体的统计信息特征的变化正是由于信息嵌入过程引起的,也就是说:只要在载体中嵌入了秘密信息,从理论上来讲,针对不同的信息嵌入方法,就可以设计出相应的攻击或隐写分析方法。是否存在这样的方法,它不在载体中进行信息的嵌入,当然也不会改变载体信息的统计特征,也能实现秘密信息隐藏,进而可以抵抗各类信息隐藏检测呢?2015年,由我国学者首次提出的无载体信息隐藏技术就是这个问题最好的答案。无载体信息隐藏是一个全新的富有挑战性的研究领域。实际上“无载体”不是说没有载体,而是指和常规的信息隐藏相比,它强调的是无需其他载体,以秘密信息为驱动直接生成含密载体。无载体信息隐藏思想一经提出就得到了国家的高度重视,并被列为国家自然科学基金委、科技部“网络空间安全”重点专项、中国通用技术研究院等研究机构的重点资助领域,并将会成为信息隐藏领域具有巨大应用潜力的研究方向。本章主要介绍了文本信息隐藏的的研究现状,对当前信息隐藏技术的研究现状与存在问题进行了分析,并对可以解决这些问题的新型信息隐藏技术——无载体信息隐藏进行了介绍。本章的内容结构安排如下:第 1 节介绍了信息隐藏的基本概念、分类及信息隐藏与其他相关技术的联系与区别;第 2 节主要介绍当前文本信息隐藏的主要方法与技术;第 3 节主要对当前文本信息隐藏存在的问题进行了分析;第 4 节给出(文本)无载体信息隐藏的概念及相关研究;最后是小结。
 
2.1 信息隐藏的基本概念
本节主要介绍的信息隐藏的概念、定义、应用、发展过程及其分类,并对信息隐藏与加密、数字水印等相关技术进行了比较,简单介绍了它们之间的区别与联系。信息隐藏技术是从上世纪90年代逐渐兴起的、信息安全领域的一个全新研究分支,它主要利用人类感官的隐蔽特性(主要是视觉或听觉冗余)和数字信号的自身冗余,把一些有价值的信息隐藏到数字信号中,在不被人类感知系统察觉的情况下进行信息的公开传递,进而达到秘密通信、完整性控制或版权保护等目的。这里的数字信号一般被称为载体,载体类型一般有文本、数字图像、数字音视频、数字图形、计算机存储的文件、计算机程序等;隐藏的有价值的信息一般为秘密信息、数字作品的版权信息或用于完整性控制与防篡改的数字签名信息,这些信息一般统称为秘密信息。信息为什么能隐藏在数字信号中呢?一方面是因为一些数字信号本身编码效率不高,具有很大冗余性,可以在这些冗余处进行信息的隐藏。另一方面,人类的感觉器官(如眼睛与耳朵)具有一定要掩蔽效应。如人的眼睛对灰度的分辨率只有几十个灰度级,通过稍微改变图像中的某些像素的灰度值来隐藏信息,并不会被人的眼睛察觉;并且人类耳朵也不能察觉声压级低于某个域值(如比较安静的环境下人类刚好能够听到的声压级别)的声音。信息隐藏一个最重要的特征就是它不仅隐藏的信息的内容,而且也隐藏了信息的存在,因而在信息安全存储与信息安全传播领域体现出重要的应用价值[2,3,8]。
..........
 
2.2 文本信息隐藏技术简介
按照隐写载体的类型,信息隐藏技术主要可以分为基于文本的、基于图像的、基于音频的与基于视频的信息隐藏技术。也有基于其他载体类型的信息隐藏技术,如计算机程序,磁盘文件等,文献[17,18]介绍了一种利用硬盘卷格式与只读ORAM (Write-Only Oblivious RAM)进行信息隐藏的方法。基于音频的信息隐藏技术按信息隐藏的过程过程可以分为频域与变化域上的信息隐藏[19]。基于视频载体的信息隐藏方法按照秘密信息嵌入位置不同,主要可以分为两类。一类是把秘密信息隐藏在视频帧像素之中,另一类是把秘密信息隐藏到视频或图像的编码过程之中[20]。数字图像由于其冗余空间大,基于图像的信息隐藏技术一直是信息隐藏技术研究的热点之一。按研究对象分类,基于图像的信息隐藏技术可以分为时域与变化域上图像信息隐藏;按载体类型分类,又可分为:彩色图像、灰度图像与二值图像的信息隐藏[21-23]。相对于图像等其他隐藏载体而言,由于文本的冗余空间不大,文本信息隐藏相对来说较为困难。但文本又是人们日常生活中经常用到的,故文本信息隐藏一直以来得到了许多研究者的关注,并取得了一些有意义的成果。文本信息隐藏技术可以粗略分为基于格式的信息隐藏技术、基于文本图像的信息隐藏技术、基于自然语言处理的信息隐藏技术三类。下面就这三类文本信息隐藏技术做简单介绍。
..........
 
第 3 章 基于自定义部件的 OOX 文本信息隐藏 ......... 26
3.1 引言 ...... 26
3.2 信息隐藏方法分析与设计 ............ 28
3.3 信息隐藏与提取算法描述 ............ 30
3.4 实验结果与分析 ....... 30
3.5 小结 ...... 38
第 4 章 基于词阶图的文本无载体信息隐藏...... 39
4.1 前言 ...... 39
4.2 信息隐藏算法设计 ............. 42
4.3 信息提取算法设计 ............. 45
4.4 实验结果与分析 ....... 46
4.5 小结 ...... 53
第 5 章 基于常见词 Hash 的文本无载体信息隐藏...... 54
5.1 前言 ...... 54
5.2 算法分析与设计 ....... 56
5.2.1 秘密信息隐藏............ 57
5.2.2 隐藏信息提取............ 59
5.3 实验结果与分析 ....... 60
5.3.1 信息隐藏与提取示例 .......... 60
5.3.2 文本大数据的重要性 .......... 62
5.4 小结 ...... 64
 
第 6 章 综合利用词阶图及常见词 hash 进行文本无载体信息隐藏
 
在前面的章节中,我们提出了两种文本无载体信息隐藏方法。为了提高信息隐藏过程中的数据安全性,在信息隐藏之前,都先要利用词转换协议对秘密信息进行转换,如何设计信息隐藏过程中的词转换协议就成了安全性的一个重要方面。在本章,我们提出了两种综合利用文本的词阶图与常见词 hash 的文本无载体信息隐藏方法。结合 hash 思想、通过巧妙设计信息隐藏与提取过程中的词转换协议,这些方法能够在不对信息隐藏载体进行任何修改的情况下实现秘密信息的隐藏与提取。由于信息隐藏过程未对隐藏载体进行任何修改,故文本无载体信息隐藏方法可以抵抗现有信息隐藏检测方法。本章内容组织如下:第 1 节介绍了信息隐藏过程中的词转换协议的基本设计思路;第 2 节详细介绍了综合利用文本的词阶图与常见词 hash 的文本无载体信息隐藏方法一;第 3 节介绍了综合利用文本的词阶图与常见词 hash 的文本无载体信息隐藏方法二;第 4 节给出了综合利用文本的词阶图与常见词 hash 的文本无载体信息隐藏方法的实例,并就文本大数据对于算法执行的重要性、算法的安全性与抗攻击性进行了分析;最后是小结。
 
6.1 引言
在前面的两章中,我们已经介绍了基于词阶图与常见词 hash 的两种文本无载体信息隐藏方法。但在进行信息隐藏前,如何设计一种合适的词转换协议以完成秘密信息中单词的转换,就成了一个挑战性问题。假设所有可能的秘密信息中不重复单词的集合为M,选定的通信密钥为 k,即选定的常见词个数为 k,显然,M 中元素的个数是远大于 k的。要寻求一种可逆的、把 M 中的单词映射为 k 个常用单词的映射方法就成了不易解决的问题。Hash 是处理大数据经常用的一种方法。我们试图借鉴 hash 思想,把秘密信息中的单词映射为常见词,方法如图 6.1 所示。从图 6.1 可以看出,在实际映射转换过程中,会出现多个单词映射到一个常见词的情景,那么如何对这些单词加以区分,以便在提取信息的过程中完成秘密信息的正常提取呢?为此,我们设计了综合利用词阶图及常见词 hash 的文本无载体信息隐藏算法。
\
........
 
结论
 
随着信息安全技术的不断发展,文本信息隐藏技术已经得到了许多研究者的关注,取得了较多的研究成果,设计出较多的文本信息隐藏方法。但这些方法有一个共同的不足之处——大都是通过在载体文本中嵌入秘密信息来实现信息的隐藏。这样一来,信息隐藏过程中的信息嵌入势必会改变隐写载体的统计分布特征,攻击者可能通过分析这种特征变化来得知隐藏信息的存在甚至提取它;另外,信息隐藏算法一旦公开,就会出现针对此隐藏方法的隐写检测方法,形成“算法公开-算法破解-设计新算法”的对抗模式。这些都已成为文本信息隐藏技术发展的一个瓶颈。为了解决这个问题,2015年我国学者首次提出了文本无载体信息隐藏技术。这种隐藏技术以秘密信息为驱动直接选择包含秘密信息的隐写载体,在不对隐写载体进行任何修改的情况下,通过载体的公开传递,完成秘密信息的传输。由于这种方法并未把秘密信息嵌入到载体中,故未改变载体的统计分布特征,可以抵抗现有的基于异常检测的隐写分析方法。无载体信息隐藏技术的提出,为信息隐藏技术的发展提供了新思路与新方向,使信息隐藏技术从以前的“嵌入”式隐藏研究逐渐向更高层次推进。本文在文本大数据(集)的环境下,通过研究英文文本大数据(集)中文本的单词分布特征,利用定义的文本词阶图及文本集常见词hash设计了几种基于英文文本大数据(集)的文本无载体信息隐藏方法,这些方法也同样可以应用于中文文本。
..........
参考文献(略)

提供海量毕业论文,论文格式,论文格式范文,留学生论文,商务报告相关资料检索服务。
本论文由代写论文网整理提供 http://www.dxlwwang.com/
需要专业的学术论文资料,请联系我们客服
本文地址:http://www.dxlwwang.com/jsj/6726.html
论文关键字:计算机硕士毕业论文 文本大数据