高斯伪谱法求解OCP

avatar
作者
筋斗云
阅读量:0

最优控制问题(Optimal Control Problem)的数值求解方法主要有间接法和直接法。间接法是根据极大值原理或者动态规划得到最优性的一阶必要条件,然后使用数值求解得到最优控制和轨迹。

间接法的优点是解的精度高,满足最优性的一阶必要条件。 缺点是收敛域很小,对初值估计要求高,且难以估计协态变量初值。而且需要求解状态方程和协态方程,增加了计算量, 算法鲁棒性较差。 对于复杂的系统, 推导一阶必要条件特别困难。
直接法是将原最优控制问题转化为非线性规划问题,然后采用非线性规划算法求解。由于不需要推导一阶必要条件,所以应用方便。直接法根据离散化变量的不同,主要可以分为只离散控制变量、只离散状态变量和同时离散控制变量和状态变量三类。第一类方法由于需要进行数值积分,计算量较大,这种算法的代表是打靶法和多段打靶法;第二类方法是微分包含法,它只离散状态变量,将控制约束转化为状态约束,可以降低变量个数,但是对于非线性比较复杂的状态方程,难以求出控制变量关于状态的显式表达式;第三类方法同时将状态变量和控制变量进行离散化,微分方程转化为代数约束条件, 这一类算法收敛速度较快,并且收敛半径大。[1]

配点法也是一种直接法,其包括欧拉法、Runge-Kutta法、Hermit-Simpson法和伪谱法。其中伪谱法包括Chebyshev伪谱法、Legendre伪谱法、Gauss伪谱法和Radau伪谱法。伪谱法因其计算效率和计算精度上的优势、良好的收敛性以及较低的初值敏感度在最优控制领域求解算法中倍受关注[2]。

Pseudospectral methods are a class of direct collocation where the optimal control problem is transcribed to a nonlinear programming problem (NLP) by parameterizing the state and control using global polynomials and collocating the differential-algebraic equations using nodes obtained from a Gaussian quadrature.[3]

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!