优化问题定义以及求解
通用定义
解决问题的开始一定是定义清楚问题。这里引用g2o的定义。
- ,为向量,表示一组参数;
- ,第k次约束参数子集;
- 可以当做观测向量,可以认为是观测协方差矩阵,是个对称矩阵;
- 是误差函数;
其实就是总测量误差的平方和,这里简单起见假设,
可以把当做单次测量误差平方和,假设,展开看
问题就是求使得测量误差平方和最小的参数的值。
求解最优问题
简化误差方程定义:。误差方程在值处进行一阶泰勒级数近似展开:
其中是在处的雅克比矩阵,代入(1)中得:
因此
问题转化为求(4)的最小值,求标量的微分
对照,得
求,注意因为非负,所以极值处为极小值。
问题又转为求解线性方程 ,所得到的解为,增量更新。以次方式不断迭代求最优问题。
优化库
在实际的工程中,我们会使用优化库求解这些优化问题。在使用这些优化库的时候,我们只需要定义好误差函数计算误差,误差函数在某值处的雅克比矩阵,定义好观测的协方差矩阵,优化库便可以帮我们求解最优问题。优化库有很多种,Ceres,g2o,gtsam等,Ceres自身有自动求导甚至不需要我们计算雅克比矩阵,但是搞清楚他们的优化原理还是很有必要的。
视觉SLAM中的优化问题
相机投影模型
已知相机内参,相机坐标系下空间点投影到像平面点的函数为:
立体视觉观测函数
假设双目相机的基线为,相机坐标系下空间点投影到左右相机平面的坐标为,假设是水平双目,则有,那么
对(为的函数)求导:
与相机投影模型整合起来有
SO3、SE3、SIM3定义及指数映射
,证明见罗德里格斯公式。
实际上
具体的证明可以参考文献[3]。
首先从最简单的位姿优化开始。
位姿优化
已知图像特征点在图像中的坐标集合, 以及对应的空间坐标,求解世界坐标系到相机的变换矩阵的最优值。
误差函数
假设变换矩阵的初始值为,加在该初值的左扰动为。
单目误差
结合(5)有
双目误差
BA
BA问题除了需要优化位姿还需要优化空间点坐标。位姿优化和上节内容一样,现在来看下空间点坐标优化相关的内容。
误差函数同样是计算重投影误差:
计算关于空间坐标点的导数
与位姿优化一样,双目的时候:
回环优化
当我们检测到回环,假设这两个帧分别为,显然两帧各自的变换矩阵已知,利用两帧中共有的特征点我们可以初步评估出这两帧的相对变换矩阵,将这两帧的相对变换矩阵作为待优化变量,作为待优化的变量的观测值(初始值)。假设系统的位姿十分精确,在检测到回环后,既定的事实是。显然现实中SLAM系统在经过长时间的运行后,一定会出现误差,那么我们优化的目标就是通过调整绝对位姿使得成立。误差函数定义为两个位姿在其切空间的残差,如果没有尺度漂移,比如说双目SLAM系统,。假设是单目SLAM系统,存在尺度漂移,则。通过求解优化问题得到了优化后的绝对位姿(或者),还需要调整空间点。假设是变换矩阵为的帧中的点,对应的世界坐标点的点,是校正后的帧中的点,其对应的世界坐标系值为。
重点来了,如何求的雅克比矩阵呢?
具体的结果及推导过程请看文献[3]。
至此SLAM相关的优化理论都已经梳理清楚,下回我们来分析openvslam中具体实现过程。
参考
[1] Giorgio Grisetti, Rainer Kummerle. g2o: A general Framework for (Hyper) Graph Optimization. 2017.
[2] 高翔. 视觉SLAM十四讲. 2017.
[3] Strasdat H. Local accuracy and global consistency for efficient visual SLAM[D]. Department of Computing, Imperial College London, 2012.
[4] Ethan Eade. Lie Groups for 2D and 3D Transformations.