前面给出了 FR 共轭梯度法在强 Wolfe 线搜索、推广 Wolfe 线搜素和广义线搜素下的收敛性,本节将给出关于 FR 共轭梯度法的一般性理论,即与其他共轭梯度法的关系,得出一般性的收敛结果。
1、简介
共轭梯度法是求解无约束优化问题常用的方法
其一般的迭代格式为
其中是参数。不同的决定不同的共轭梯度法。
1964 年,Fletcher 和 Reeves 首次提出了解决非线性函数的共轭梯度法,我们称为 FR 共轭梯度法,其形式为
由于不同的决定不同的共轭梯度法,现在我们考虑与 FR 方法相关的一般共轭梯度法,若有
1992 年,Gilbert 和 Nocedal证明了在强 Wolfe 线搜素,即
且时,满足 (5) 关系的的共轭梯度法是充分下降并且全局收敛的。戴彧虹推广到时,满足 (5) 关系的的共轭梯度法是下降的并且全局收敛的。再后来就是由 杜学武 和 徐成贤 推广到广义 Wolfe 线搜素,本质是很简单的,我之前也写过,不过后来发现被前人已经写了。在此,我们只是给出 文 [2] 中的证明。
2、收敛性证明
定理:设目标函数下方有界,导数 Lipschitz 连续。考虑 FR 共轭梯度法 (2)、(3) 和 (4) ,参数满足 (5)。如果,则方法在下述意义下全局收敛
证明:将 (3) 式两端与作内积,并利用 (5) 式得
因为,由强 Wolfe 线搜素知
将上式第二个不等式递推,并注意到,得知
对于所有的成立,利用 (6) 的第一个不等式和 (7) 式以及,得
故每一个搜素方向均为下降方向。记
由 (6) 的第一个不等式可知,若,则,从而必有
由之前的内容可知或者后面会再次谈到这个问题,若,且,则
3、结束语
这节内容很简单,但是却是 FR 共轭梯度法最有用的一节,也经常会用到。而且在此多说一句,如果 定理 1 中的这一界限在常数意义下不可被放宽,否则便会有反列表明算法不收敛。
参考文献
[1] Gilbert J C, Nocedal J. Global convergence properties of conjugate gradient methods for optimization[J]. SIAM, J Optimization, 1992, 2(1) : 21-42.
[2] 戴彧虹. 非线性共轭梯度法[M]. 科学出版社, 2000.
[3] 杜学武, 徐成贤. 由 FR 共轭梯度法控制的两类优化算法的全局收敛性[J]. 高等学校计算数学学报, 2000, 4: 311-318.