第12回：最適レギュレータ（LQR）

1. 最適制御問題

システム $\dot{\mathbf{x}} = A\mathbf{x} + B\mathbf{u}$ に対し、評価関数：

J = \int_0^\infty (\mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u}) dt

を最小化する制御入力 $\mathbf{u}(t)$ を求める。

最適な制御入力は状態フィードバックの形：

\mathbf{u}^* = -K\mathbf{x} = -R^{-1}B^T P \mathbf{x}

$P$ は代数リッカチ方程式（ARE）の正定値解：

A^T P + PA - PBR^{-1}B^T P + Q = 0

J^* = \mathbf{x}_0^T P \mathbf{x}_0

Q_{ii} = \frac{1}{x_{i,\max}^2}, \quad R_{jj} = \frac{1}{u_{j,\max}^2}

許容される最大値の逆2乗で正規化。

Q = \begin{bmatrix} q_1 & 0 \\ 0 & q_2 \end{bmatrix}, \quad R = r

$(A, B)$ が可安定、$(A, Q^{1/2})$ が可検出ならば、閉ループ系は漸近安定。

LQR制御器は以下を保証：

[I + K(jωI - A)^{-1}B]^*R[I + K(jωI - A)^{-1}B] \geq R

MATLAB: `[K, P] = lqr(A, B, Q, R)`

Python (scipy): `K, P, E = lqr(A, B, Q, R)`

リッカチ方程式の数値解法：

J = \mathbf{x}(t_f)^T S \mathbf{x}(t_f) + \int_0^{t_f} (\mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u}) dt

時変リッカチ方程式を後退積分で解く。