初出:日本ロボット学会誌,2014 年 32 巻 6 号 p. 499-502
本ページでは,これまでに日本ロボット学会誌に掲載された解説記事の中から注目度の高い記事をHTML形式で紹介しています.HTMLへの変換時に著者紹介,キーワードなど一部の情報は省略しています.また,レイアウトはオリジナル記事とは異なります.
PDF形式のオリジナル記事はこちらでご覧になれます.引用する際は,本Webページではなくオリジナル記事を引用してください.
[解説]
モデル予測制御の基礎
足立修一(慶應義塾大学)
1 はじめに
様々なフィードバック制御理論が世の中にあふれている. 制御理論を利用するユーザの立場から制御理論を眺めると,«「たくさんの制御理論が提案されているが, いったい私の制御対象には, どの制御理論/方法を適用したらよいのか?」と思うのではないだろうか. その回答を得るための手がかりとして, 非常に大雑把な分類であるが, 図1に制御理論の発展をまとめた.
大学学部などで講義される制御理論は 古典制御[1]である. 現在でも産業界の現場で利用される制御のほとんどは PID 制御に代表される古典制御であると言われている. 古典制御は非常に実用的な制御法であるが, 制御対象が1入力1出力系に限定され, さらにコントローラの制御パラメータのチューニングは, 理論的というよりは経験と勘による試行錯誤に頼っているのが現状である.
1960年初頭, フィードバック制御の理論体系を構築したのがカルマンである. 状態空間に基づく制御系設計法は, 古典制御に対比して 現代制御[2]と呼ばれている. 周波数領域における設計法であった古典制御と異なり, 現代制御は時間領域で多変数制御系を設計する数学的な方法である.
1980年ころに現代制御の問題点を克服するために, プラントのモデルの不確かさを考慮した ロバスト制御[3]が提案された. 制御に代表されるロバスト制御は, 周波数領域における設計法に回帰したもので, しかも多変数制御系を系統的に設計できる方法で, 当時, 精力的に研究され, 実用化検討も大きく進展した. 図に示したように, ロバスト制御は古典制御の後継者とみなすこともできる.
制御理論のアカデミックなコミュニティーではなく, 制御の現場から1980年代に誕生したのが モデル予測制御[4]である. モデル予測制御は最適制御に基づいているため, 現代制御の後継者であると位置づけられる.
現代制御, ロバスト制御, モデル予測制御は, いずれも制御対象の数学モデルに基づいた制御系設計法, すなわちモデルベースト制御(Model-Based Control : MBC)である. そのため, これらの方法を実問題に適用したときに成功するかどうかは, 利用するモデルの品質に大きく依存しており, その意味からも制御対象のモデリングは非常に重要なステップである[5].
本稿の目的は, 例題を用いてモデル予測制御の基礎について平易に解説することである. その結果, モデル予測制御はどのような制御対象に適しているか, という設問の答えのヒントを与えられれば幸いである.
Figure 1: 制御理論の発展
2 基本的なモデル予測制御問題
基本的なモデル予測制御(MPC)の構成を 図2に示した. 本解説では1入力1出力離散時間線形システムをプラント(制御対象)とし, 図において, プラント出力を , 制御入力を と表記した. ここで, は離散時間を表す. 図2において, はプラント出力が追従する信号である設定値軌道である. 通常, フィードバックコントローラは, この と を用いて制御入力 を計算するのだが, MPC では ではなく入力変化量
(1)
を計算することに注意する. そして, 図示したように, 離散時間積分器を用いて から に変換する. よって, 入力 は MPC コントローラの出力を離散時間積分したもの, すなわち, 次式になる.
(2)
Figure 2: MPC 制御系の構成
以下では, 図2においてMPCコントローラと表記した部分の仕組みについて, MPC の重要なキーワードを用いて説明していこう.
[1] 参照軌道 現時刻を とし, このときのプラント出力を とする. 以下では を直接, 設定値軌道 に追従させるのではなく, 参照軌道と呼ばれる量 に追従させることを考える. 図2に示したように, 参照軌道とは から出発して, プラントが設定値軌道 に戻るべき理想的な軌道である. 参照軌道は, プラント出力が設定値軌道に向かう速さを規程する.
現時刻 における追従誤差を
(3)
とする. 指数関数的な参照軌道の場合, 現時刻から 時刻ステップ後の追従誤差が
(4)
となるように参照軌道を決定する. ただし, はサンプリング周期である. すると, 現時刻から 時刻後の参照軌道は,
(5)
となる. なお, 参照軌道を用いずに とおいてもよい.
[2] 内部モデル 現時刻 から 時刻先 までの区間のプラント出力の予測値 を計算するためにプラントの内部モデルを用いる. ここで, は 予測ホライズンと呼ばれる( 図3参照)«. 内部モデルとしては, 当初はステップ応答モデルが用いられていたが, 現在では, 伝達関数モデルや状態空間モデルが利用されている. このように, プラントのモデルを用いて予測を行い, それを用いて制御則を設計するのでモデル予測制御と呼ばれる.
Figure 3: MPC 制御の基本的なアイディア
予測値 は, この区間で未来に印加される入力 に依存する. すなわち, 入力の未来値は未知なので, このままでは を計算できない. この点が時系列の予測問題と大きく異なる点である. そこで,«「入力は, 予測ホライズンの最初の何ステップ(これを 制御ホライズンと呼び, とする)では異なる値をとるが, その後は図3に示したように一定値を取り続ける」と仮定する. この仮定より明らかなように, 通常, と設定する.
[3] 後退ホライズン 二つのホライズン と は有限長なので, モデル予測制御では従来の最適制御のように無限時刻先までの最適化を行わず, 各時刻において有限時刻先までに最適化を行う.
時刻 において予測ホライズン先までの時刻区間 で最適化を行い, 次の時刻 では までの時刻区間で最適化を行う. このように, 現時刻から一定時刻先までの最適化を各時刻で繰り返していくことを 後退ホライズン(receding horizon)方策と呼ぶ. 地平線(ホライズン)に向かって一歩進むと, 地平線は一歩後退してしまい, また一歩進んでも同じように地平線は後退する. これを繰り返していっても, ずーっとその人と地平線の距離は一定のままであるということとの類似性から後退ホライズンという呼び方がつけられた.
有限区間での最適化の考え方は, 囲碁や将棋の戦い方に似ている. すなわち, 囲碁や将棋では, 相手がどのような手を指すのか分からないので, その場その場で最善手を考えるが, 通常, 初心者では数手先, 名人クラスになると, 例えば 100 手先まで予測して, 次の一手を考えている. モデル予測制御の用語を使えば, 強い人ほど, 長い予測ホラインズンの場合でも高精度な予測モデルをもっているということになる.
2.1 モデル予測制御の制御目的
以上の準備のもとで, モデル予測制御の制御目的は,«「プラント出力を参照軌道に一致するような入力を選ぶこと」である. 通常, 予測ホライズンの区間すべてでプラント出力と参照軌道を完全に一致させるような入力を選ぶことはできない. そこで, 本稿では最も簡単な場合について考える.
プラント出力を予測ホライズンの終点, すなわち, 時刻 でのみ参照軌道 に一致するように入力を選ぶ問題を考える. これは単一の一致点をもつ問題であり, 制御ホライズンを とする. この場合,
(6)
とおくことになる. このとき, 制御方程式は
(7)
となり, この式を満たすような制御入力 を決定することがここで考えている問題である.
まず, 内部モデルを用いてプラントの自由応答の予測値 を求める. ここで, 自由応答とは, 最新の入力 がそのまま印加され続けると仮定したときのプラントの応答である. また, 単位ステップ信号を印加し, ステップ後のプラントの応答を とおくと, 重ね合わせの理より,
(8)
が成り立つ. ただし,
(9)
である. 式(8)に式(7)を代入すると,
(10)
が得られる. 式(9)より, 制御入力は,
(11)
となる. この場合, 未知数は の一つであり, 制御方程式は式(7)の一つだった. 未知数と方程式数が等しかったので, 唯一解を得ることができた.
3 モデル予測制御の基本的な例題
本章では, 簡単な例題を通してモデル予測制御の基本について学ぶ.
例題 1 伝達関数が
(12)
である一次系をプラントとする. 設計条件として,, 参照軌道は の指数関数, ホライズンは , とする. また, 現時刻を とし, 最新の入出力データの値は,, とする. このとき, 予測ホライズン 先の1点のみを一致点とするモデル予測制御系を構成したい. 時刻 のときの制御系の振る舞いを手計算で求めよ.
解答 応答計算を行うために,式(12)の離散時間伝達関数から入出力信号の差分方程式を求めると,
(13)
が得られる. これがプラントの内部モデルである. 一致点 におけるステップ応答 は, 式(13)より計算でき, が得られる.
Figure 4: 例題(時刻 のとき)
次に, 時刻 のときの計算を行う. まず, 追従誤差は であり, これを用いて参照軌道は式(5)より計算できる.
とすると, 自由応答は,
となる.式(10)より
が得られ, これより最適入力は次式となる.
(14)
以上より得られた結果を 図4に示した. のときも同様に制御入力を計算できる.
例題1で得られた結果をまとめておこう.
• 出力の未来値を予測し, それに基づいて最適制御入力を 決定するために対象のモデルが必要であるが, この例題では対象の離散時間伝達関数から差分方程式モデルを導出し, それからステップ応答の値を計算し, それらを用いた.
• 一致点が一つで, 制御ホライズンが の場合には, 最適化すべき制御入力の変化量の数(1個)と制御方程式 (出力の予測値が参照軌道に一致するという式(7))の 数(1個)が等しいので, 唯一解をもつ.
例題 2 例題 1と同じプラントを考え, 設定も同じとする. ただし, 一致点の数を から に増やす. すなわち, 一致点を と表記するとき, 次式のようにおく. . このとき, 現時刻 における最適制御入力 を求めよ.
解答 例題 1と同じように参照軌道, 自由応答, 入力の変化量が満たすべき式を求めると, 次のようになる.
例題 1と異なり, のみが未知数であり, 方程式は2本の過決定問題になった. このような場合には, 最小二乗法を用いて解を求めることができる. さらに, 一致点が複数個で, 制御ホライズンが 以上の場合においても, 最適制御則を求める計算は最小二乗問題に帰着する.
以上の例題では, アクチュエータの飽和などのような入出力などに制約を設けていないが, 制約がある場合には, 最小二乗問題を制約つき最小二乗問題に変更すればよい. すると, QP(Quadratic Programming:二次計画)問題になる. しかし, 各時刻において制約つき最適化問題を解かなければならないので, 計算負荷の問題が生じる.
4 まとめ~モデル予測制御の特徴
本解説のまとめとして, モデル予測制御の特徴を列挙しよう.
• モデル予測制御を用いるためには, 複数個の一致点におけるステップ応答の値と, それらの一致点における自由応答が計算できるモデルがあればよい. そのため, 必ずしも離散時間モデルを用いる必要はなく, ステップ応答/インパルス応答モデル, 連続時間モデルなど, 実時間よりも高速で動作するシミュレーションモデルがあればよい. しかしながら, 離散時間モデルは容易に利用できるため, これが利用されることが多い.
• モデル予測制御では, フィードバック則という規則(ルール)を決めているのではなく, 制御ホライズンにおける現在から有限個先までの入力の最適値を, 最適化手法により直接計算している.
このことについて, 簡単に補足説明しておこう. 例えば, LQ(Linear Quadratic)制御では, 状態フィードバック則
(15)
を最適制御問題を解くことにより求めている. この が決定されれば, どのような状態 に対しても, 式(15)の規則に従って最適入力を計算できる. それに対して, モデル予測制御では, 現時刻における実際の最適入力の値 を最適化すべき変数の一つとして, 直接最適化計算により求めている.
• 図5より明らかなように, これまで述べてきたモデル予測制御は開ループ制御である. したがって, モデル化誤差が存在したり, 外乱が存在する場合には, それらの影響を低減化するフィードバック機構(例えば, 一種の外乱オブザーバ)をモデル予測制御系に加える必要がある.
• 一致点, 予測・制御ホライズンの長さなどをどのように選ぶのかは, チューニングパラメータの問題になり, モデル予測制御においても試行錯誤の問題は依然として残る.
Figure 5: モデル予測制御系の構造
References
[1] 足立修一:MATLABによる制御工学. 東京電機大学出版局,1999.
[2] G.F. Franklin, J.D. Powell and A. Emami-Naeini: Feedback Control of Dynamic Systems (6th edition). Prentice Hall, 2009.
[3] K. Zhou, J.C. Doyle and K. Glover: Robust and Optimal Control. Prentice Hall, 1995.
[4] J.M. Maciejowski著, 足立・管野訳: モデル予測制御~制約のもとでの最適制御. 東京電機大学出版局,2005.
[5] 足立修一:システム同定の基礎. 東京電機大学出版局,2009.
足立修一(Shuichi Adachi)1986年慶應義塾大学大学院工学研究科電気工学専攻博士課程修了. 同年(株)東芝 総合研究所. 1990年宇都宮大学工学部電気電子工学科助教授, 2002年同教授. 2003年から04 年ケンブリッジ大学客員研究員, 2006年慶應義塾大学理工学部物理情報工学科教授となり, 現在に至る. 工学博士. システム同定理論・制御理論とそれらの産業応用に関する研究に従事. 計測自動制御学会, 電気学会, 日本機械学会, IEEE などの会員.adachi