邓述慧
自从50年代Robbins-Monro[1]提出随机逼近算法用来求回归函数的零点或极值以来,人们不仅用概率的方法而且用微分方程的方法[3,4]去处理它.近几年来,出现了随机变界截尾算法,它克服了事先假定算法[5]有界的本质困难.[6]、[7]研究了二步算法,去掉了对某一Liapunov函数存在性的要求,[8]将[5]和[6]的方法结合起来,在较弱的条件下求解了优化问题.[9]用这些思想给出了连续时间变界截尾的两步算法.[5—9]讨论的是无约束随机逼近问题.对于有约束的确定性系统的极值问题,我们可以用Lagrange乘子法,也可以用罚函数的算法[11],A.Miele将Lagrange乘子和罚函数结合提出了罚-乘子算法[12],Kushner[4]将罚-乘子算法用在有约束的随机逼近算法中,在假定算法有界的条件下证明了收敛性.本文将变界截尾的随机逼近算法和罚-乘子算法结合起来,用到带约束的优化问题中,既不事先假定算法有界,也不要求存在某一Liapuaov函数,得到了算法的收敛性.