首页 >  硕士论文 > 软件工程硕士论文 >   正文

软件工程硕士论文:单幅图像的三维人体姿势估计研究

添加时间:2018-01-14 20:44:24   浏览:次   作者: www.dxlwwang.com
专业论文资料, 搜索论文发表论文代写论文网为你解忧愁!详情请咨询我们客服。
获取免费的论文资料? 欢迎您,提交你的论文要求,获取免费的帮助

1 绪论

 
1.1研究背景与意义
高级的人机交互一直以来都是许多人的理想,也是未来科技发展的一个重要方向。它的技术难点在于如何在没有鼠标、键盘等硬件设备的情况下依然能够实现人与机器之间的交流互动。目前在生活中已经得到广泛使用的语音识别技术和人脸识别技术虽然使得人机交互技术迈上了一个新台阶,但是还远远无法满足人们的需求。人类交流的方式不仅仅有语言和表情,还包括了众多的肢体动作(如无奈时会摊手、否定时会摇头、兴奋时会鼓掌等),想要获得完善的高级人机交互体验,人体的动作识别技术也需要被研发出来。在此背景下,人体姿势估计技术应运而生。目前,人体姿势估计在异常行为智能监测系统、体育运动姿势分析、体感互动游戏、虚拟人物设计、与人体有关的图像和视频数据的存储与检索等领域都有着广泛的应用[1],潜在的经济价值巨大。(1)异常行为智能监测系统。传统的视频监测系统只是起到了简单的记录功能,当有事故发生时,需要依靠监控人员及时发现并发出警报,否则就只能在事故发生后取出存储的视频数据进行调查取证。而对于基于人体姿态估计的异常行为智能监测系统,不仅能去除无意义的冗余视频数据,还能对画面中异常的人体活动进行实时地分析处理,例如当画面中发生打架、偷窃等行为时,能及时记录并发出报警[2]。基于人体姿态估计的异常行为智能监测系统如图 1.1 所示。(2)体育运动姿势分析。例如在篮球运动的训练中,可以利用基于人体姿势估计的视频分析系统对运动员训练时的视频数据进行处理,恢复他们在训练时的投篮姿势并计算出相关的运动参数,通过对这些数据进行专业的分析,找出训练时投篮姿势的缺陷,从而为下次训练提供针对性的指导。而在战术分析方面,也可以利用基于人体姿势估计的视频分析系统对对手比赛时拍摄的视频数据进行处理,恢复其投篮时的三维姿势,进而分析对手的投篮习惯和动作缺陷并制定出战术方案。基于人体姿势估计的体育运动姿势分析示例如图 1.2 所示。
........
 
1.2人体姿势估计的研究现状
卡内基梅隆大学机器人研究所的 Deva Ramanan 等人在 2016 年提出一种“三维人体姿势估计=二维姿势估计+三维姿势匹配”的方法[3],他们先对输入的单幅人体图像进行二维姿势估计得到图像中人体的二维骨架形态,然后将其与数据库中的三维人体姿势的二维投影进行匹配,最后选择出匹配吻合度最大的三维人体姿势作为最终结果输出。该方法的优点是得到的三维人体姿势准确度较高,缺点是三维人体姿势估计结果的好坏完全依赖于三维人体姿势数据库,这就要求数据库中必须要有丰富的人体姿势种类,如此也给算法的匹配速度带来了巨大的压力。另外,卡耐基梅隆大学的 Leonid Sigal 教授等人针对单目图像的三维姿势估计中常用到的结构式或预测式的方法对训练数据集存在偏向性,会导致算法在测试数据集中性能下降的问题,在 2014 年提出一种无监督域适应的方法[4],该方法根据从样本图像中评估而得的训练比率以及测试边际值为图像分配权重,再利用带权重的训练样本图像进行学习,以此来缓解对数据集的偏向性。同年,Leonid Sigal 还编写了一本讲解人体姿势估计的专业书籍[5],给出了人体姿势估计的内涵和外延,以及相关的理论和方法。马克斯普朗克智能系统研究所的 Michael Black 等人于 2017 年提出一种在野外环境中能自动进行三维人体姿势估计的方法[6],他们首先分别在人体的手腕、小腿、背部以及头部位置附着上 6 个惯性测量装置(Inertial Measurement Units,IMUs),用以测量人体运动的方向和加速度,然后利用一种稀疏惯性姿势(Sparse InertialPoser,SIP)方法恢复完整的三维人体姿势。该方法的优点是重建出的三维人体形象逼真且姿势准确,缺点是需要提前在人体上安装传感器。另外,马克斯普朗克信息学研究所的 Sikandar Amin 等人在 2014 年提出一种从多视角的多目标人体图像中进行三维人体姿势估计的方法[7],他们首先从摄像机视图的检测器中获得匹配的人体关节点位置,再对其进行三角剖分并创建一个简化的离散状态空间,然后引入一种三维图案结构模型(3D Pictorial Structures,3DPS)来解决三角剖分后出现的歧义性以及在多目标情况下出现的肢体互相遮挡的问题,最后从简化的离散状态空间中推导出三维人体姿势。该方法的优点是可以对遮挡的情况进行处理,且同样适用于单目标的情况,缺点是依赖于从每个视角中检测到的二维人体关节点位置,当检测到的结果不理想时,会导致三维人体姿势估计失败。
.........
 
2 三维人体姿势估计的步骤与方法
 
从单幅图像或视频中进行三维人体姿势估计的过程如图 2.1 所示,该过程可以分为四个步骤:(1)人体轮廓的提取、(2)虚拟骨骼曲线的抽取、(3)二维关节点坐标定位、(4)三维姿势重建。其中人体轮廓的提取是指从单目图像或视频中得到人体的轮廓图像;虚拟骨骼曲线的抽取是指从人体轮廓图像中得到人体虚拟骨骼曲线;二维关节点坐标定位是指从人体虚拟骨骼曲线中定位人体关节点二维坐标;三维姿势重建是指从人体二维关节点坐标中重建人体在三维空间中的大致形态结构。本章将详细介绍前三个步骤所用的方法和原理,第四个步骤是本文重点研究的内容,也是本文具有创新点以及取得一些研究成果的地方,将在本文第三章中进行论述
 
2.1人体轮廓的提取
单幅图像或视频中的人体区域可以被称为目标,而其余图像区域可以被称为背景。人体轮廓提取技术需要做的工作就是将包含人体的目标区域和不含人体的背景区域进行分离,然后从目标区域中提取出人体轮廓。这项工作对于正常人类来说轻而易举,因为人类的视觉系统具备自动划分的能力,然而对数字图像处理而言却十分困难。目前常用的人体轮廓提取方法为背景差分法[15-16]。通常利用背景差分法初步获得的人体区域会存在孤立的大小不一的噪声点,会对后续的处理造成干扰,影响人体轮廓提取的效果。常使用的解决方法是利用中值滤波对初步获得的人体区域图像进行去噪。中值滤波利用某像素邻域窗口范围内所有像素点灰度值的中值代替该像素的灰度值,对在提取出的人体区域图像中出现的噪声点有很好地消除作用。
.........
 
2.2虚拟骨骼曲线的摄取
本章首先将从单幅图像或视频中进行三维人体姿势估计的过程划分为四个步骤,分别为人体轮廓的提取、虚拟骨骼曲线的抽取、二维关节点坐标定位和三维姿势重建,然后重点介绍前三个步骤所用的方法和原理。在人体轮廓的提取中,使用了背景差分法并结合中值滤波技术及形态学修复方法进行人体轮廓图像的提取;在虚拟骨骼曲线的抽取中,先将人体轮廓分为长条形的肢体轮廓以及圆形的关节轮廓,接着使用了一个能量函数来抽取人体轮廓中的虚拟骨骼曲线;在二维关节点坐标定位中,先总结了人体关节点出现的三个规则,接着利用前两个规则从提取出的骨骼曲线上寻找显性关节点位置,再利用第三个规则并结合人体解剖学上的肢体长度比例确定隐性关节点和剩余关节点的位置。
.........
 
3 基于遗传优化的自适应凸松弛三维人体姿势估计 ...........19
3.1 三维人体姿势估计的凸松弛方法 .......19
3.2 基于遗传优化的自适应凸松弛 ..........24
3.2.1 参数自适应更新 .......24
3.2.2 参数取最优初始值 .............26
3.2.3 闭式解表达式的改进 .........30
3.3 本章小结 ....30
4 实验与结果分析 .............31
4.1 实验环境 ....31
4.2 实验数据 ....31
4.3 实验中三维人体的表现形式 ....32
4.4 实验结果的评价指标 .....32
4.5 实验与分析 ..........33
4.6 本章小结 ....42
 
4 实验与结果分析
 
4.1 实验环境
当前,对于最终三维人体形态结构的表现形式主要可以分为四种类型[28]:点线模型[29-32]、普通几何体模型[3,9,18-19,21,33-36]、增强几何体模型[37-38]、以及三角网格精细模型[39-40]。四种三维人体模型如图 4.2 所示,图 4.2(a)为点线模型,用点代表人体关节点,用线段代表人体骨骼;图 4.2(b)为普通几何体模型,使用椭圆体、圆柱体或长方体等代表三维人体的各肢体关节;图 4.2(c)为增强几何体模型,重建出的三维人体用超二次曲面等组成;图 4.2(d)为三角网格精细模型,利用大量的三维三角网格及空间点来表现重建后的三维人体。本文的改进算法是以提升三维人体姿势估计凸松弛方法的收敛速度以及姿势估计的准确度为出发点,因此在实验结果的评价方面,将从算法的迭代次数、姿势估计的准确度以及所需的处理时长三点进行对比评估。在姿势估计准确度的评估上,采用的是三维人体姿势估计凸松弛方法中提出的一种误差评价函数 PrimRes,当 PrimRes<10- 3时,可认为利用算法重建的三维人体姿势准确度符合要求(PrimRes 的值越小,重建的准确度越高),关于该误差评价函数在文献[9]和文献[34]中都有相关的说明。
.........
 
结 论
 
本文主要针对单幅图像的三维人体姿态估计展开了研究工作,文章得到的结论如下:(1)本文算法比原凸松弛方法对图像的处理速度更快、姿势估计误差更小。本文优化了原凸松弛方法中迭代变量的初始值和更新方式,并改进了三维物体映射到数据字典的稀疏表达方式,加快了算法的收敛速度并提高了姿势估计的准确度。(2)本文算法对图像中目标的类型适应性强。在图像目标为单人或多人的情况下,利用本文算法都可以重建出对应的三维人体姿势。(3)本文算法对图像的拍摄角度具有较强的鲁棒性。对于从不同角度拍摄的人体图像,在准确标记出关节点二维坐标的基础上,本文算法能够取得良好的三维姿势估计结果。
..........
参考文献(略)

提供海量毕业论文,论文格式,论文格式范文,留学生论文,商务报告相关资料检索服务。
本论文由代写论文网整理提供 http://www.dxlwwang.com/
需要专业的学术论文资料,请联系我们客服
本文地址:
论文关键字:软件工程硕士论文 凸松弛 自适应 遗传优化