自律移動と最適制御

17K Views

December 20, 25

#日本ロボット学会 #自律移動 #最適制御 #ロボット工学 #経路計画 #機械学習

スライド概要

2025年12月2日のロボット学会のセミナー（https://www.rsj.or.jp/event/seminar/news/2025/s163.html）で発表した内容です。200人弱の人たちが半笑いで聞いてて、直後の学会で半笑いで面白かったと言われた内容です。（最近こんなのばっかり・・・）

「ロボットとか実空間で何かに接触しながら動くものの制御は、変分法で1本道の制御シーケンスを求めても、なかなか思ったように動かない」という、ロボットを触り始めて25年間感じていることをそのまま話しただけです。

Ryuichi Ueda

@ryuichiueda

スライド一覧

プログラマー

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

ROSからROS 2への切り替えのときの作業と考えたこと

日本ロボット学会 ros ソフトウェアロボット

Ryuichi Ueda 32.1K

20240501確率ロボティクス入門第1回

Ryuichi Ueda 16.5K

20240508確率ロボティクス入門第2回

Ryuichi Ueda 11.3K

20240515確率ロボティクス入門第3回

Ryuichi Ueda 9.4K

日本ロボット学会第143回ロボット工学セミナー

日本ロボット学会

Ryuichi Ueda 5.7K

各ページのテキスト

月日自律移動と最適制御大域計画, 障害物回避, 機械学習, 潜在空間, 伝統的な制御の統一的な理解のために千葉工業大学上田隆一 This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License. 年12 2 RSJセミナー 2025

https://creativecommons.org/licenses/by-sa/4.0/

今日やること本日の話の動機（これだけで終わらないようにします）探索問題と最適制御確率モデルを使った制御問題の記述と様々な分野の関係年12月2日 RSJセミナー 2025 2

月日この発表の動機: いろんな人がいろんな人と話がかみ合わない制御ゴリゴリの人/学習の人/確率ロボティクスの人で互いに会話が合わない制御ゴリゴリの人と制御ゴリゴリの人が話が合わないなんかそんな座談会の記事を見たような気がします制御をポントリャーギンの最大（最小）原理から考えている人とベルマン方程式から考えている人で会話が合わない話が盛り上がってほしい（なんなら「上田あいつアホだ」でもいいので）年12 2 RSJセミナー 2025 3

話が盛り上がる鍵: 一般化・抽象化一般化すると、もしかしたらほかの分野のことも分かるかもしれない抽象化の山を登り、具体的な課題に下山高く上るとどこにも降りていける遭難しそうとかそういうのはナシで話題の模倣学習やVLAとかも分かるかもしれないということで・・・今回は自律移動なので、そこから問題を抽象化してみましょう分かること現在、自律移動研究の主流の方法はどうなのか？隣接分野はどうなっているのか？年12月2日 RSJセミナー 2025 4

今日の話がうまくできるかどうか分からないので考えはこの本の9章に書いてあります誰も9章まで辿り着いてないのではないか？青色の本でもオレンジ色の本でも同じ現象お食事中の方すみません年12月2日 RSJセミナー 2025 5

探索から制御問題へ 2025 年12月2日 RSJセミナー 6

話の出発点: ロボットの大域経路計画（探索）実空間中にロボットの現在地から目的地まで線を引くダイクストラ、A*、RRT、... いまだ現役一方、移動ロボットや自動車を自律移動させることは難しい自己位置推定がずれる（今回は直接扱わず）障害物をうまく避けれない・・・作成年12月2日 RSJセミナー 2025 図: AtsushiSakai/PythonRoboticsで 7

https://github.com/AtsushiSakai/PythonRobotics

月日一般的なアプローチ: 問題の分割大域計画+諸問題の解決大域計画+障害物回避だいたいの場合、これで問題ない現場であれば問題が出たらまた潰せば良い本当にこれで問題ない？理論上解決できないのか？根本から解決する方法はないのか？問題を整理しましょう年12 2 RSJセミナー 2025 ⼤域計画回避 8

月日ナビゲーション（大域+局所）の問題 = 制御探索は手段であって、制御問題と考えることが妥当制御: 好ましく無い状態を、好ましい状態の集合に持っていくなにか力を加えて現象制御ロボットが目的地でない場所に目的地にいる状態にしたい機械が振動している振動してない状態に戻したいライントレースのロボットがラインからずれたライン中央に戻したい洗濯物が洗濯機の中に畳んで収納したい大雑把に考えると全部同じ 2025 年12 2 RSJセミナー 9

10.

大雑把な枠組みの制御問題: 最適制御問題マルコフ決定過程（MDP）でもあるけど最適制御と言います状態を終端状態の集合の任意の要素まで導きたいには速度や時間、制御不可能なものの変数も入れられるという力をかけると次の時刻に状態がに遷移 ※とりあえず離散時関系で考えます状態遷移にはコスト: 「時間消費」、「エネルギー消費」、「危険性」などを点数化終端状態にも点数: コストの総和を最小化したい年12月2日 RSJセミナー 2025 x u u ? u u u u xf 10

11.

単純な（将棋盤上の）移動の問題の場合問題ロボットの位置（2次元） : 前後左右（状態遷移: 決定論的） : step 2025 右図: 問題と解の例重要状態ごとに終端状態までのコストが見積もれる最良のを選ぶと1ステップのコストとコストの見積もりの減少が釣り合ういまの状態と解は無関係年12月2日 RSJセミナー 10 9 10 9 8 7 9 8 9x 8 7 6 5 878 7 6 4 34 654 3 2 5 4 3 2 1 0x f 11

12.

最適制御問題の解の性質（どう解くかという話とは別）「釣り合い」の式: ベルマン方程式期待値 : 最適状態価値関数（最適な値関数）から各状態で最適な行動が得られる : 最適方策もう一つ重要: 最適でなくても方策に対してが存在 : 2025 ここで「あとどれくらいで仕事が終わるかな？という見積もりが正確だと正しい行動ができる」年12月2日 RSJセミナー 10 9 10 9 8 7 9 8 9x 8 7 6 5 878 76 4 34 654 3 2 5 4 3 2 1 0x f 12

13.

探索で得られる大域計画の解の性質本道の方策ができている（右図の矢印）最適である保証はない経路からちょっと外れたところは基本無視を決定論的に解釈は方策を求めるついでに計算されている概算途中の計算で周辺のも求められるが捨てられがちかなり雑に解いているきっちり方策通りにロボットが動けば問題はない、が 1 年12月2日 RSJセミナー 2025 7 5 6 4 3 2 1 13

14.

よく問題になること: 経路のチャタリング経路を再計算したら変わった/また計算したら戻った再計算が必要になる場合自己位置推定の結果がジャンプした突然の障害物の出現（再計算をやめられない）もっと良いルートの探求チャタリングは危険下手にプログラムすると中途半端な動きに自動車: 中央分離帯で死ぬ（よくある事故）なぜか自動車より遅い移動ロボットでも起こる ROSのNavigation Stackのサンプル（小手先で解決できるかもしれないが）根本的な原因は？ 2025 年12月2日 RSJセミナー 14

15.

原因大きくチャタリングする=間に良くない状態が存在良くない: の値が悪い入ってはいけない探索のたびに↑を忘れる「入っていいや」となるなんでそうなっちゃうのか: 線（経路）で考えているからどうするか: 面（正確には場）で考える事故を起こした状態もゴール（終端状態）だと考えてやを計算（次ページ） 2025 年12月2日 RSJセミナー良くない状態経路ではなく場で考える 15

16.

月日「事故もゴール（終端状態）」「事故を避ける方策」の計算方法を大きな値で固定状態遷移にペナルティーを与える方法もある（等価）線ではなく面（場）で計算危険な箇所近傍のを全部解く状態遷移はちゃんと確率的に扱うギリギリを攻めないがなめらかに探索や多くの制御、最適化では障害物を「境界（制約）条件」として扱ってしまう（いいの？）「最適な経路」「事故を避ける方策」脆いセミナー年12 2 RSJ 2025 V(xf)=10000000 この領域の状態も xf V(xf)=0 xf 衝突全⼒回避⽅策ができる（本来のゴールより近いので先にできる）（衝突ギリギリまで回避しようとする） V(xf)=10000000 16

17.

探索結果+障害物回避の方策の組み合わせはダメ？。ただし互いに矛盾しないように（難しい）矛盾がない: 両方の方策から計算されるに停留点がない問題は1つなのに2つ別の⽅策⽭盾よくある矛盾角曲がりたい角の壁から遠ざかりたいで無限ループに同じ状態で別の方策が混在 1994年の名古屋空港での中華航空機の事故着陸したいパイロットと地面から離れたいオートパイロット OK 年12月2日 RSJセミナー 2025 ゴールと危険個所が近いと案外難しい⾓は⽭盾しやすい凡例壁避け⽅策計画された経路 17

18.

方策の貼り合わせを避けて制御問題を解いてる例はあるのか？実はある（一長一短という話は一旦棚上げして）強化学習と価値反復（動的計画法）例: 白地図を持たせたロボットの価値反復でのナビゲーション[上田RSJ2022] 価値反復強化学習をモデルベースで解く方法（説明が逆ですが）確率的な状態遷移を扱える地図全体とロボットの周辺で全く同じ計算（方策が矛盾しない）地図全体: 大域計画用ロボットの周辺: 障害物回避用実機での障害物回避の例[Ueda2023] 年12月2日 RSJセミナー 2025 18

19.

ここまでのまとめ移動ロボットの経路計画を最適制御の観点から考えた探索や変分法を使う場合、次の問題への適切な対処が必要チャタリングの問題ゴールへの移動と危険回避行動が同時に扱えない問題確率的な状態遷移が考えられない問題さらに一言方策を貼り合わせる手法を論文に書くときは上記の問題にちゃんと触れてほしい（特に障害物回避の論文）「強化学習は安全性に疑問が・・・」という意見は本当か？学生のとき、MCLのときにもおんなじことを言われた年12月2日 RSJセミナー 2025 19

20.

最適制御から様々な分野への話そもそもなんでこのような話をしているのか年12月2日 RSJセミナー 2025 20

21.

確率ロボティクスの本質（個人的な解釈） = 制御のパラダイムシフト状態方程式を確率モデルで表現状態方程式: 観測方程式: 太字にしなかった理由: ベクトルから記号を一般化自己位置推定やSLAMはその派生であって本質ではない青い本のうしろ1/3は行動決定や探査の話（読む人少ない） 2005年頃からそう思っているけど世間はそう思ってない年12月2日 RSJセミナー 2025 全部うしろは制御の話（だってロボットなんだもん） 21

22.

月日確率モデルで表現することで失うもの状態方程式: 観測方程式: 一般化されすぎていて既存の制御理論から離れるか、再解釈が必要になるリアプノフやポントリャーギンの話、あらゆる微分方程式・変分法の話前提にこれのある人とない人では話がすれ違う再解釈の例: グラフ上で微分を定義してなにかするなど学部のときの指導教官の故湯浅先生の研究一定の割合の人の「制御とはこういうもの」から外れる交流がなくなりがちンに⽅策を搭載可能なので、価値反復を使うと低次元の非線形制御問題をほぼ完璧に解いて遅いマイコ 25 みんな使ったほうがいいと思って年年12 2 RSJセミナー 2025 22

23.

月日確率モデルで表現することで得られるもの状態方程式: 観測方程式: 状態や制御（行動）の解釈が自由に確率モデルが決められればなんでもよいややこしい実世界を扱うには都合がよい 2000年頃にロボット周辺で取り入れていた分野機械学習（強化学習・ニューラルネットワーク）確率ロボティクス年12 2 RSJセミナー 2025 23

24.

確率モデル+ベルマン方程式の面白さ「さえ決まっていれば状態はなんでもよい」状態空間に距離や内積の定義は不要（測度の定義が必要）むしろ、が距離のようなものの定義になめらかで矛盾がないいずれかをうまく近似表現するとロボットが動くこの面白さが出ている典型的な例（議論の余地あり）強化学習で脚ロボットがよく歩くのは、特異点の問題から解放されているから？ニューラルネットの内部状態が微分（誤差逆伝播）で生成されるのがまた面白い年12月2日 RSJセミナー 2025 24

25.

どこをモデル化するのか内部状態の空間を滑らかにすることが正解かもしれない実世界を厳密に、滑らかにモデル化するのではなく学習の分野の人たちが前から言っていたことで特に新しい視点でもない方法論が確立して顕在化あとは体を柔らかくして実世界のごつごつを吸収確率ロボティクス側はこの考えが希薄だったかもロボットを動かそうとすると、結局、状態をベクトルで表して環境の地図を正確にしようとすることに年12月2日 RSJセミナー 2025 こんな雑然とした部屋（私の部屋）はモデル化したくない 25

26.

月日内部状態の構成（令和最新版）超多次元空間への対応・次元の呪いの克服変分オートエンコーダ（VAE）、拡散モデル、フローマッチング（FM）が作る潜在空間や分布（右図）複雑な分布を圧縮表現 Transformerが入出力する言語や映像のトークン（埋め込みのベクトル）の空間ねこがこたつに⼊っているまるいねこねむい ... 単語の埋め込み（分散表現） 2025 年12 2 RSJセミナー ... おじさがよっぱらってる p encoder p q decoder z x x 潜在空間興味のある画像を学習データに選択猫の画像の集団ゴッホの絵狸の画像の集団集団間の隙間: 無数のでたらめな画像⽝の画像の集団ムンクの絵画像の画素の超多次元分布 CLIP [Radford 2021]でできるvision-language空間 26

27.

ロボット基盤モデルにおける空間表現制御という観点から見ると面白い（寄りだったり寄りだったり両方だったり）寄りの手法（ACTや） VAEや拡散モデル、FMでさまざまな動作シーケンスの分布を学習・生成で、⾃⼰位置推定でもSLAMでもなかったりする私の博士論文のテーマも「方策の圧縮表現」の推定寄りの手法（RT-1, 2など）指示と画像からを良くする次の行動だけ出力これが完璧だと（遅くても）なんでもできる年12月2日 RSJセミナー 2025 雑⾳出⼒⼊⼒（動作シーケンス）encoder 潜在空間 decoder （動作シーケンス）条件（画像以外のセンサ値）条件（画像を含むセンサ値） ACT[Zhao2023]の学習 = 出⼒ z 0 decoder （動作シーケンス）条件（画像を含むセンサ値） ACTの使⽤どう動けば価値が上がる（タスク完了に近づく）だろうか？ 27

28.

まとめ 2025 制御という観点から見た経路計画については途中のまとめのとおり制御を確率モデル（だけ）で考える方法おそらく実世界の複雑性と格闘するには良い方法 VLAもそう解釈できる（ということに勉強して今更気づきました）解いている問題が同じなのだから当然ではある手法ではなく問題に着目する気持ちがあれば理解できる・話ができるその先（妄想）もし、空間中のさまざまな場をで正確に計算できる計算機ができたらどうなる？のような場が磁場のように一瞬で決まる計算機粘菌のコンピュータはこれに近い年12月2日 RSJセミナー 28