摘 要:基于双目视觉的目标定位是当前计算机视觉研究领域的热点问题,文章介绍了双目视觉的基本原理,对其关键技术进行了深入研究,并将基于灰度相关性的立体匹配算法应用到双目视觉定位系统中。设计双目视觉定位实验,实验表明文章方法能够实现一般的双目视觉中的目标定位问题。
关键词:双目视觉;立体匹配;目标定位
引言
双目视觉是利用已经标定了的不同位置的两台摄像机(或者一台摄像机经过移动或旋转)拍摄同一幅场景得到的两幅二维***像, 应用***像处理、***像匹配、三维重建等方法进行处理,从而实现从二维***像恢复场景三维***像的一种模拟人的双目视觉的方法。
运动目标的位置确定在机器人视觉导航、公共场景监控、智能交通等领域有着十分广泛的应用背景,而在上述应用领域,双目视觉较单目视觉有着显然不可替代的优势,故文章主要对基于双目视觉的运动目标的定位问题进行研究。
1 双目视觉的基本原理
1.1 线性摄像机模型
***性摄像机模型中,定义了三种坐标系[1]:***像坐标系、摄像机坐标系与世界坐标系。通过三种坐标系的相互关系可以得到世界坐标系表示的点P坐标(Xw,Yw,Zw)与其投影点p的坐标(u,v)间的关系。如***1所示。其代表的线性摄像机模型由式(1)表示。
M1由f、dx、dy、u0、v0决定,由于这些参数只与摄像机内部结构有关,故称这些参数为摄像机的内部参数。M2由摄像机相对于世界坐标系的方位而定,被称为摄像机的外部参数。
1.2 视差原理
标准的双目视觉系统成像关系如***2所示,实际上不同的系统结构都可以变换为这种简单的标准结构。***2中,Ol、Or分别为左、右两个摄相机的光心,Ol、Or之间的距离为b,相机焦距为f。点P到OlOr连线间的距离为z。
2 摄像机标定
摄像机标定是进行目标定位的必要过程,通过摄像机标定可以得到摄像机的内外参数。常用标定方法[2]有:传统标定方法、自标定方法等。文章采用传统标定方法对摄像机进行标定。在传统标定方法中,首先摄像机的前方放置标定参照物,由摄像机获取标定物的***像。通过***像处理的方法获取标定物上的特征点,同时对标定物特征点的世界坐标进行精确测定。最后利用一系列标定点在***像像面上成像点的像素坐标与其世界坐标之间的对应关系,借助非线性优化的方法,计算出摄像机数学模型中包含的内外参数。
采用传统标定方法的标定过程[3]如下:
(1)通过改变模板的位置,从不同的角度和位置来拍摄模板***像,并检测拍摄的模板***像上的角点,获取角点坐标。
(2)根据角点计算单应矩阵,根据单应矩阵求解摄像机部分参数初值,计算出摄像机内外参数和畸变参数。
3 基于灰度相关性的立体匹配
立体匹配是寻找同一空间目标在不同视点下投影***像中像素间的一一对应关系。通根据匹配基元的不同,双目视觉中的立体匹配算法分为[4]:区域匹配、特征匹配、相位匹配。文章选用一种基于灰度相关性的立体匹配算法。
基于灰度相关性的立体匹配步骤如下:首先在***像中选择一点Pl(x,y)作为待匹配点,以此点位中心,选择一个大小为(2M+1)*(2N+1)的匹配窗口。然后依据具体的匹配方法在待匹配***像中寻找对应点窗口,即在待匹配***像中依次对比同一极线上的Pl(x,y)与Pr(x+i,y)的相似程度,依照某种度量标准对比两***像窗口的相似程度,并认为相似度最高的窗口的中心像素点与点Pl(x,y)成功匹配。
在上面的两种匹配代价下,差别系数越大,模板与***像之间的区别就越大。为了在***像匹配到模板的目标,需要使用一个给定的阈值对相似性***像sad和ssd进行阈值分割,阈值在试验中获取。
4 实验设计及结果分析
实验采用两个摄像头作为摄录工具,***像分辨率都为720*480,两个摄像头间隔24cm平行放置。软件采用基于OpenCV的C++语言进行编程。
实验分为两个部分:
4.1 摄像机标定
首先对左右摄像机进行标定,获取摄像机的内外参数,采用7*9的国际象棋棋盘作为标定模板,每个棋盘格规格为25mm×25mm。运用OpenCV中提供角点定位函数及双目标定函数编写程序进行标定,角点提取成功的***像如***3,标定结果如表1。
从表1中数据可以看出,相机的主点并不位于***像中心,两者存在一定的偏差。由于两台摄像机的摆放位置比较理想,所以标定得到的旋转矩阵接近于单位矩阵,平移矢量的第二、三个分量远小于第一分量。
4.2 立体匹配及目标定位
标定完成后,在同样的拍摄环境下拍摄一段视频,选择视频中的行人为定位目标,对左摄像机中的行人进行目标跟踪,并选取跟踪算法中的目标区域为模板,采用基于灰度相关性的立体匹配算法,在右摄像机中对同一行人进行目标匹配。同时在匹配正确的情况下,记录目标在定点的***像坐标值,并计算其深度信息,以实现目标定位。
软件平台采用VS2005,基于C++语言进行编程,具体算法步骤如下:
(1)采集左右***像,对***像进行预处理;(2)在左***像中对目标进行跟踪,并确定模板区域,利用文章算法在右***像中与待测区域进行比较,比较值满足阈值相似性条件认为是匹配点;(3)若是比较值不满足阈值相似性条件,则移动同一极线上的待测区域中心点,重复步骤(2);(4)记录在定点处目标的坐标值利用式(2),计算出相应的深度信息。
立体匹配的实验结果如***4所示。
***4中,为视频中第100帧的立体匹配情况,其中左***中的的目标区域是由跟踪算法确定的,右***中的目标区域是由立体匹配算法确定的,从试验结果可以看出,右***的立体匹配比较准确。
为了检验文中目标定位的准确性,在视频拍摄之前选定了若干行走路线上的确定点,并手工测量了其深度值。在双目视觉的目标定位算法实验中,以行人到摄像机拍摄平面的距离为实际深度,算法实验得到的相应确定点的深度数据与手工测量的深度数据如表2所示。
表2中1号数据对应***4。由表2中的数据计算得到的平均相对误差为1.95%,可以看出采用双目视觉方法的运动目标定位是可以实现的,定位精度能够满足一般要求。
对实验过程进行分析,发现误差产生原因主要有以下两个方面:
(1)在计算深度的过程中使用的某些数据,如焦距f,像素点实际对应尺寸等存在误差,导致深度计算中出现二次误差;
(2)由于立体匹配算法本身存在缺陷,导致匹配的***像坐标产生误差,最终对深度信息造成影响。
针对上述原因造成的误差,文章提出一些改进的建议:
(1)对最终的深度计算结果进行参数补偿,以减小绝对误差;
(2)在立体匹配过程中,选取匹配***像前后的多帧***像,分别进行匹配并及计算深度,取平均值作为该帧目标的深度;
(3)改进立体匹配算法,使之能够更好地应用于运动目标系统。
5 结束语
运动目标的位置确定是计算机视觉领域的重要研究内容,文章首先对双目视觉的基本原理进行介绍,然后深入研究了双目视觉关键技术中的摄像机标定和立体匹配方法,采用传统标定方法及基于灰度相关性的立体匹配算法,设计了双目标定及目标定位实验,实验结果表明,文中采用的算法能够实现一般应用需求中的运动目标的定位问题。
参考文献
[1]马颂德,张正友.计算机视觉-计算理论与算法基础[M].北京:科学出版社,1998.
[2]颜卓.基于双目视觉的运动物体检测系统研究[D].沈阳:沈阳大学,2012.
[3]Gary Bradski,Adrian Kaehler.学习OpenCV[M].北京:清华大学出版社,2009.
[4]时洪光.基于双目视觉的运动目标定位研究[D].青岛:青岛大学,2010.
[5]王逸林.基于区域匹配算法的双目立体匹配技术的研究[D].大连:大连海事学院,2012.
转载请注明出处学文网 » 基于双目视觉的目标定位研究