第13回:リッカチ方程式

Riccati Equation

1. 最適制御問題の定式化

1.1 無限時間レギュレータ問題

$$\min_{\mathbf{u}} J = \int_0^\infty (\mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u}) dt$$

制約:$\dot{\mathbf{x}} = A\mathbf{x} + B\mathbf{u}$

1.2 有限時間レギュレータ問題

$$\min_{\mathbf{u}} J = \mathbf{x}^T(t_f) S \mathbf{x}(t_f) + \int_0^{t_f} (\mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u}) dt$$

2. 代数リッカチ方程式(ARE)

2.1 定常問題の解

無限時間問題では、最適コストは $V(\mathbf{x}) = \mathbf{x}^T P \mathbf{x}$ の形。

$P$ は 代数リッカチ方程式 を満たす:

$$A^T P + PA - PBR^{-1}B^T P + Q = 0$$

2.2 最適ゲイン

$$K = R^{-1}B^T P$$

最適制御則:$\mathbf{u}^* = -K\mathbf{x}$

2.3 解の存在条件

$(A, B)$ が可安定、$(A, Q^{1/2})$ が可検出ならば、

ARE は唯一の正定値解 $P \geq 0$ を持つ。

3. 微分リッカチ方程式(DRE)

3.1 有限時間問題

時変ゲイン $K(t) = R^{-1}B^T P(t)$ を使用。

$P(t)$ は微分リッカチ方程式を満たす:

$$-\dot{P} = A^T P + PA - PBR^{-1}B^T P + Q$$

終端条件:$P(t_f) = S$

3.2 後退積分

$t = t_f$ から $t = 0$ へ向かって積分。

4. ハミルトン行列による解法

4.1 ハミルトン行列

$$H = \begin{bmatrix} A & -BR^{-1}B^T \\ -Q & -A^T \end{bmatrix}$$

4.2 安定固有空間

$H$ の安定固有値に対応する固有空間から $P$ を計算:

$$\begin{bmatrix} X_1 \\ X_2 \end{bmatrix} \text{ が安定固有空間} \Rightarrow P = X_2 X_1^{-1}$$

5. 最適性の検証

5.1 ハミルトン・ヤコビ・ベルマン方程式

最適コスト関数 $V(\mathbf{x})$ は HJB 方程式を満たす:

$$\min_{\mathbf{u}} \left[ \mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u} + \frac{\partial V}{\partial \mathbf{x}}(A\mathbf{x} + B\mathbf{u}) \right] = 0$$

5.2 最適制御の導出

$$\mathbf{u}^* = -\frac{1}{2}R^{-1}B^T \frac{\partial V}{\partial \mathbf{x}}^T = -R^{-1}B^T P \mathbf{x}$$

6. 数値解法

6.1 反復法(ニュートン法)

$$A_k^T P_{k+1} + P_{k+1} A_k + Q + P_k B R^{-1} B^T P_k = 0$$

ここで $A_k = A - BR^{-1}B^T P_k$

6.2 Schur分解法

ハミルトン行列の Schur 分解を利用した数値安定な方法。

7. LQR の性質

7.1 安定余裕

  • ゲイン余裕:無限大($K$ を 0.5 から $\infty$ まで変化させても安定)
  • 位相余裕:少なくとも 60°

7.2 リターン差等式

$$[I + K(sI-A)^{-1}B]^T R [I + K(sI-A)^{-1}B] = R + B^T(-sI-A^T)^{-1}Q(sI-A)^{-1}B$$

8. まとめ

  • LQR の最適ゲインは代数リッカチ方程式の解から計算
  • ハミルトン行列の固有値解析が有効
  • LQR は優れたロバスト性(ゲイン・位相余裕)を持つ
  • 有限時間問題では微分リッカチ方程式を後退積分