第13回：リッカチ方程式 - 制御工学ノート

1. 最適制御問題の定式化

\min_{\mathbf{u}} J = \int_0^\infty (\mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u}) dt

制約：$\dot{\mathbf{x}} = A\mathbf{x} + B\mathbf{u}$

\min_{\mathbf{u}} J = \mathbf{x}^T(t_f) S \mathbf{x}(t_f) + \int_0^{t_f} (\mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u}) dt

無限時間問題では、最適コストは $V(\mathbf{x}) = \mathbf{x}^T P \mathbf{x}$ の形。

$P$ は 代数リッカチ方程式 を満たす：

A^T P + PA - PBR^{-1}B^T P + Q = 0

K = R^{-1}B^T P

最適制御則：$\mathbf{u}^* = -K\mathbf{x}$

$(A, B)$ が可安定、$(A, Q^{1/2})$ が可検出ならば、

ARE は唯一の正定値解 $P \geq 0$ を持つ。

時変ゲイン $K(t) = R^{-1}B^T P(t)$ を使用。

$P(t)$ は微分リッカチ方程式を満たす：

-\dot{P} = A^T P + PA - PBR^{-1}B^T P + Q

終端条件：$P(t_f) = S$

$t = t_f$ から $t = 0$ へ向かって積分。

H = \begin{bmatrix} A & -BR^{-1}B^T \\ -Q & -A^T \end{bmatrix}

$H$ の安定固有値に対応する固有空間から $P$ を計算：

\begin{bmatrix} X_1 \\ X_2 \end{bmatrix} \text{ が安定固有空間} \Rightarrow P = X_2 X_1^{-1}

最適コスト関数 $V(\mathbf{x})$ は HJB 方程式を満たす：

\min_{\mathbf{u}} \left[ \mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u} + \frac{\partial V}{\partial \mathbf{x}}(A\mathbf{x} + B\mathbf{u}) \right] = 0

\mathbf{u}^* = -\frac{1}{2}R^{-1}B^T \frac{\partial V}{\partial \mathbf{x}}^T = -R^{-1}B^T P \mathbf{x}

A_k^T P_{k+1} + P_{k+1} A_k + Q + P_k B R^{-1} B^T P_k = 0

ここで $A_k = A - BR^{-1}B^T P_k$

ハミルトン行列の Schur 分解を利用した数値安定な方法。

[I + K(sI-A)^{-1}B]^T R [I + K(sI-A)^{-1}B] = R + B^T(-sI-A^T)^{-1}Q(sI-A)^{-1}B