搜索高级搜索
机器人网互动社区技术讨论专区机器视觉立体视觉介绍(一)
机器视觉使机器人具有视觉感知功能的系统,是机器人系统组成的重要部分之一。
大家在做什么
发表新主题  收藏 打印 推荐 
作者 问题:

立体视觉介绍(一)

发布时间: 2014-10-21 下午2:01

作者: 无线GBIT通信

等级: 学有小成

积分: 531 分

发帖数: 101 次

网站总积分: 531 分

经验值: 23.0

查看用户的所有发言

查看用户的个人主页

立体视觉是计算机视觉领域的一个重要课题,它的目的在于重构场景的三维几何信息。立体视觉的研究具有重要的应用价值,其应用包括移动机器人的自主导航系统,航空及遥感测量,工业自动化系统等。

1. 引言
立体视觉是计算机视觉领域的一个重要课题,它的目的在于重构场景的三维几何信息。立体视觉的研究具有重要的应用价值,其应用包括移动机器人的自主导航系统,航空及遥感测量,工业自动化系统等。
一般而言,立体视觉的研究有如下三类方法: 
(1) 直接利用测距器(如激光测距仪)获得程距(range data)信息,建立三维描述的方法; 
(2) 仅利用一幅图象所提供的信息推断三维形状的方法; 
(3) 利用不同视点上的,也许是不同时间拍摄的,两幅或更多幅图象提供的信息重构三维结构的方法。 
第一类方法,也就是程距法 (range data method),根据已知的深度图,用数值逼近的方法重建表面信息,根据模型建立场景中的物体描述,实现图象理解功能。这是一种主动方式的立体视觉方法,其深度图是由测距器(range finders)获得的,如结构光(structured light)、激光测距器(laser range finders) 等其他主动传感技术 (active sensing techniques)。这类方法适用于严格控制下的环境(tightly controlled domains),如工业自动化的应用方面。
第二类方法,依据光学成象的透视原理及统计假设,根据场景中灰度变化导出物体轮廓及表面,由影到形(shape from shading),从而推断场景中的物体。线条图的理解就是这样的一个典型问题,曾经引起了普遍的重视而成为计算机视觉研究领域的一个焦点,由此产生了各种各样的线条标注法。这种方法的结果是定性的,不能确定位置等定量信息,该方法由于受到单一图象所能提供信息的局限性,存在难以克服的困难。
第三类方法,利用多幅图象来恢复三维信息的方法,它是被动方式的。根据图象获取方式的区别又可以划分成普通立体视觉和通常所称的光流(optical flow)两大类。普通立体视觉研究的是由两摄像机同时拍摄下的两幅图象,而光流法中研究的是单个摄像机沿任一轨道运动时顺序拍下的两幅或更多幅图象。前者可以看作后者的一个特例,它们具有相同的几何构形,研究方法具有共同点。双目立体视觉是它的一个特例。
立体视觉的研究由如下几部分组成: 
(1) 图象获取 (image acquisition),
用作立体视觉研究的图象的获取方法是多种多样的,在时间、视点、方向上有很大的变动范围,直接受所应用领域的影响。立体视觉的研究主要集中在三个应用领域中,即自动测绘中的航空图片的解释,自主车的导引及避障,人类立体视觉的功能模拟。不同的应用领域涉及不同类的景物,就场景特征的区别来分,可以划分成两大类,一类是含有文明特征(cultural features)的景物,如建筑、道路等; 另一类是含有自然特征的景物和表面(natural objects and surfaces), 如山、水、平原及树木等。不同类的景物的图象处理方法大不相同,各有其特殊性。
总之,与图象获取相关的主要因素可归纳如下: 
(a) 场景领域 (scene domain), 
(b) 计时 (timing),
(c) 时间(照明和阴影)(time of day (lighting and presence ofshadows)), 
(d) 成像形态(包括特殊的遮盖)(photometry (including special coverage)),
(e) 分辨率 (resolution),
(f) 视野 (field of view),
(g) 摄像机的相对位置 (relative camera positioning).
场景的复杂程度受如下因素的影响: 
(a) 遮掩 (occlusion),
(b) 人工物体(直的边界,平的表面) (man-made objects (straight edge, flat surfaces)),
(c) 均匀的纹理区域 (smoothly textured areas),
(d) 含有重复结构的区域 (areas containing repetitive structure)。
(2) 摄像机模型 (camera modeling),
摄像机模型就是对立体摄像机组的重要的几何与物理特征的表示形式,它作为一个计算模型,根据对应点的视差信息,用于计算对应点所代表的空间点的位置。摄像机模型除了提供图象上对应点空间与实际场景空间之间的映射关系外,还可以用于约束寻找对应点时的搜索空间,从而降低匹配算法的复杂性,减小误匹配率。
(3) 特征抽取 (feature acquisition),
几乎是同一灰度的没有特征的区域是难以找到可靠匹配的,因而,绝大部分计算机视觉中的工作都包括某种形式的特征抽取过程,而且特征抽取的具体形式与匹配策略紧密相关。在立体视觉的研究中,特征抽取过程就是提取匹配基元的过程。
(4) 图象匹配 (image matching),
图象匹配是立体视觉系统的核心,是建立图象间的对应从而计算视差的过程,是极为重要的。
(5) 深度计算 (distance(depth) determination),
立体视觉的关键在于图象匹配,一旦精确的对应点建立起来,距离的计算相对而言只是一个简单的三角计算而已。然而,深度计算过程也遇到了显著的困难,尤其是当对应点具有某种程度的非精确性或不可靠性时。粗略地说,距离计算的误差与匹配的偏差成正比,而与摄像机组的基线长成反比。加大基线长可以减少误差,但是这又增大了视差范围和待匹配特征间的差别,从而使匹配问题复杂化了。为了解决这一问题出现了各种匹配策略,如由粗到精策略,松驰法等。 
在很多情况下,匹配精度通常是一个象素。但是,实际上区域相关法和特征匹配法都可以获得更好的精度。区域相关法要达到半个象素的精度需要对相关面进行内插。尽管有些特征抽取方法可以得到比一个象素精度更好的特征,但这直接依赖于所使用的算子类型,不存在普遍可用的方法。
另一种提高精度的方法是采用一个象素精度的算法,但是利用多幅图象的匹配,通过多组匹配的统计平均结果获得较高精度的估计。每组匹配结果对于最后深度估计的贡献可以根据该匹配结果的可靠性或精度加权处理。
总之,提高深度计算精度的途径有三条,各自涉及了一些附加的计算量: 
(a) 半象素精度估计 (subpixel estimation),
(b) 加长基线长 (increased stereo baseline),
(c) 几幅图的统计平均 (statistical averaging over several views)。
(6) 内插 (interpolation).
在立体视觉的应用领域中,一般都需要一个稠密的深度图。基于特征匹配的算法得到的仅是一个稀疏而且分布并不均匀的深度图。在这种意义下,基于区域相关匹配的算法更适合于获得稠密的深度图,但是该方法在那些几乎没有信息(灰度均匀)的区域上的匹配往往不可靠。因此,两类方法都离不开某种意义的内插过程。最为直接的将稀疏深度图内插成稠密的深度图的方法是将稀疏深度图看作为连续深度图的一个采样,用一般的内插方法(如样条逼近)来近似该连续深度图。当稀疏深度图足以反映深度的重要变化时,该方法可能是合适的。如起伏地貌的航空立体照片的处理中用这种方式的内插也许是比较合适的。但是这种方法在许多应用领域中,尤其是在有遮掩边界的图象的领域中,就不适用了。
Grimson 指出可匹配特征的遗漏程度反映了待内插表面变化程度的相应限度,在这种基础上,他提出了一个内插过程[2]。换一角度来看,根据单幅图象的“由影到形”的技术,用已经匹配上的特征来建立轮廓条件和光滑的交接表面可以确保内插的有效性。这些方法结合起来,可以使内插过程达到合乎要求的目标。内插的另一种途径是在已有的几何模型与稀疏深度图之间建立映射关系,这是模型匹配过程。一般而言,要进行模型匹配,预先应将稀疏深度图进行聚类,形成若干子集,各自相应于一种特殊结构。然后找每一类的最佳对应模型,该模型为这种特殊结构(物体)提供参数和内插函数。如 Gennery用这种方法来发现立体对图片中的椭园结构,Moravec 用于为自主车探测地面。
2. 双目立体视觉(Binocular Stereo Vision)
2.1 双目立体视觉模型
双目立体视觉理论建立在对人类视觉系统研究的基础上,通过双目立体图象的处理,获取场景的三维信息,其结果表现为深度图,再经过进一步处理就可得到三维空间中的景物,实现二维图象到三维空间的重构。Marr-Poggio-Grimson [1] 最早提出并实现了一种基于人类视觉系统的计算视觉模型及算法。双目立体视觉系统中,获取深度信息的方法比其它方式(如由影到形方法)较为直接,它是被动方式的,因而较主动方式(如程距法)适用面宽,这是它的突出特点。
双目立体视觉系统中,深度信息的获得是分如下两步进行的: 
(1) 在双目立体图象间建立点点对应,
(2) 根据对应点的视差计算出深度。
第一部分,也就是对应点问题,是双目立体视觉的关键; 第二部分是摄像机模型问题。双目立体视觉模型中,双摄像机彼此参数一致,光轴平行且垂直于基线,构成一共极性 (epipolar) 结构,这样做是为了缩小对应的搜索空间,只有水平方向的视差,简化了对应过程,如下图所示。 

如上图所示,设空间一点P(X,Y,Z)在两个平行放置的完全相同的摄象机中像点分别是(x1,y1).(x2,y2),则在知道基线长B和焦距f的情况下,可以计算出深度

这是双目立体视觉的基本原理,即根据视差来恢复立体信息。
2.2 匹配基元
匹配基元是指匹配算法的最小匹配对象,它是由特征抽取算法产生的。在建立立体视觉系统时,必须根据环境的特点和应用的领域选择适当的匹配基元。匹配基元可以是:
(1) 过零点 (zero-crossings),
(2) 边界与线片段 (edge and line fragments),
(3) 线性特征 (linear features),
(4) 边缘轮廓 (object boundaries),
(5) 兴趣算子抽取的特征点(如角点等)
基元作为匹配算法处理的基本单位,是局部特征,应包含以下一些信息: 
(1) 维量(点、线、边界等) (dimensionality),
(2) 尺度(空间频度,长短、大小、方向等)(size (spatial frequency)),
(3) 亮度(对比度) (contrast),
(4) 语义量 (semantic content),
(5) 稠密度 (density of occurrence),
(6) 简单可量度的分布特征 (easily measurable attributes),
(7) 唯一性/突出性 (uniqueness/distinguishability)
2.3 匹配算法
匹配算法就是在两幅图象的匹配基元之间建立对应关系的过程,它是双目立体视觉系统的关键。实际上,任何计算机视觉系统中都包含一个作为其核心的匹配算法,因而对于匹配算法的研究是极为重要的。
为了比较全面地考察匹配算法,这里不妨将双目立体视觉的匹配算法扩展到更一般的情况来分析:假设给定两幅同一环境的图象,这两幅图象可能由于摄取的时间、方位或方式的不同而有差别,如双目立体视觉系统所摄取的两幅图象、地图与遥感或航测图象等,如何找到彼此对应的部分? 对于这个问题,一般有两种考虑途径: 
(1) 灰度分布的相关性,
(2) 特征分布的相似性。
因而就有两类算法: 
(1) 基于灰度的算法 (intensity based),
(2) 基于特征的算法 (feature based)。
如果按照控制策略分,有如下几种: 
(1) 粗到精多层次结构 (coarse-to-fine,hierarchical),
(2) 引入约束条件的松驰法 (constraints, relaxation),
(3) 多级表示的决策结构 (multilevel representation)。
2.3.1 基于灰度的匹配算法
基于灰度的算法是指图象处理中所称的区域相关方法 (area-correlation technique),它是解决对应问题的一个最直观最简单的方法。在一幅图象中以一点为中心选定一区域(窗口),在另一幅图象中寻找与该区域相关系数最大的区域,把该找到的区域的中心认为是原来那区域中心的对应点。这里所说的图象包括经过某种特殊处理如Gauss滤波后的图象。
这种算法计算量大,但可以得到整幅图象的视差图。该算法对噪音很敏感,考虑到计算量,窗口不宜开得过大,因而可能匹配的选择较大,误对应可能性大,不适于灰度分布均匀的图象,较适于灰度分布很复杂的图象,如自然景物等。采用该方法的关键在于排除或减轻噪音的影响。通常采用多层次相关对应及多幅图象的统计平均处理方式来实现。如 D. B. Gennery [2]采用九幅图象多级处理方式来实现对应求解。

引用 回复 鲜花 ( 1) 臭鸡蛋 ( 0) 有新回复时发送邮件通知
机器人网互动社区刷爆朋友圈的中国最牛停车机器人,其实它是这样的!
第 1 楼

回复主题:立体视觉介绍(一)

发布时间: 2014-10-22 下午4:19

作者: xuzhouqxy

等级: 初入江湖

积分: 91 分

发帖数: 40 次

网站总积分: 92 分

经验值: 1.0

查看用户的所有发言

查看用户的个人主页

谢谢分享
这次终于有人讲清楚了人工智能和量子计算的关系了 虚拟现实技术及应用 (下载 29 次)
美的收购库卡或流产:欧盟专员反对关键技术外流 手把手教你一个简易的"平衡机器人" (下载 66 次)
小米无人机再现“价格屠夫”本色:2499远低市场预期 【极客装备】教你DIY私人无人机 (下载 89 次)
引用 回复 鲜花 ( 0) 臭鸡蛋 ( 0)
立体视觉介绍(二)    下一帖  

与  ti , 系统 , bsp , 视觉 , 双目立体视觉  相关的话题
快速回复
用户名: 
美国的游客       (您将以游客身份发表,请登录 | 注册 )  
标题: * 你还可以输入80
评论: * 你还可以输入20000
分享到: 新浪微博   qq空间   qq微博   人人网   百度搜藏  
验证码:  * 
维护专业、整洁的论坛环境需要您的参与,请及时举报违规帖子,如果举报属实,我们将给予相应的积分奖励。
谢谢您的热心参与!
返回机器视觉 | 返回技术讨论专区
本论坛仅陈述专家或个人观点,并不代表机器人网网站立场。
返回论坛页首