1. はじめに
本稿は2023年6月6日から6月9日にかけて熊本城ホール,オンラインで開催された,第37回人工知能学会全国大会のレポートである.レポート対象として6月7日に行われた, OS-21d:世界モデルと知能のセッションを扱う.このセッションは全5件の発表で構成される.本稿で取り扱うセッションのテーマである世界モデルというのは,実環境を予想・想像する技術のことを指している.現在,Minecraftにおいてダイアモンド収集のタスクをゼロから学習したことで注目されているDreamerV3など,注目されている分野である.
2. 発表内容
1件目は慶応義塾大学の是方らによる「Switching Head-Tail Funnel UNITERによる対象物体および配置目標に関する指示文理解と物体操作」[1]の発表である.本発表では,高齢化が進む日本で需要が高まる生活支援ロボットが,物体操作指示を理解し実行するための手法を提案し,より実用的なモデルの作成を目的としている.筆者が興味を持った点は,推論回数を大幅に削減し,より実用化に適したモデルになっている点である.人間が住んでいる空間には大量の物体が存在し,移動させたい箇所も多様であり,タスクを実行するために多くのPCによる計算時間がかかってしまう可能性が考えられる.加えて,よりスムーズにタスクを実行するために高性能のPCを導入することも考えられるが,コスト面が気になるところである.提案手法により上記の2点の問題を解消することで,人々がより手軽に生活支援ロボットを手にする日が近づくと考えられる.
2件目は名古屋大学の青木らによる「世界モデルベースマルチエージェント強化学習におけるエージェント間の公平性を考慮した経路計画手法の提案」[2]の発表である.本研究では,深層強化学習を用いたマルチエージェント経路計画において,報酬にエージェント全体の公平性を考慮する因子を導入することを提案している.また,実験結果として,従来手法と比較し,エージェント同士が足並みを揃えてゴールしていたことが報告されている.今後,工場等の産業業用途への導入が期待されているマルチエージェント経路計画だが,実際に導入を考える際,エージェント同士だけでなく,人,モノ,効率性など,その他の無数の要素を考慮していく必要がある.提案手法では公平性について考慮していたが,今後,産業への実用化に向けてどのように無数にある要素を考慮した報酬設計にしていくのか興味深い.
3件目は慶應義塾大学の五十嵐らによる「多視点カメラ画像のゲート付き対照学習に基づく実ロボット行動生成」[3]の発表である.本発表では,従来手法のMulti-View Dreamingにゲート機構の導入等を行い,より外乱に強いモデルを提案している.実世界では日々刻刻と環境が変化し,知能ロボットを利用するためには,汎化性能の高いモデルの作成は必要不可欠である.データの水増し・拡張等を行い,外乱に強いモデルを学習する手法は一般的だが,本研究ではモデルの構造にも改良を加えている点で興味深い.人間は経験値が少ない場合であろうと,様々な環境の変化に対応できる.そのような点を考慮するとデータ拡張ではなく,より人間に近いモデル構造の作成を目指していくことが重要であると考えている.そのような点で,本研究で提案されたモデルが人間に近いモデルなのか非常に興味深い.
4件目は東京大学の河村らによる「類似グラフ環境における事前知識を活用した方策学習のための世界モデル」[4]の発表である.本発表では,グラフベース環境において,事前知識を利用したより効果的な学習を行うことのできる,世界モデルを利用した強化学習手法を提案している.実験結果では,迷路探索問題において提案手法がランダム探索法を上回っていることが示されている.筆者が興味を持った点は,「6.おわりに」の「より複雑なグラフ構造を持つ環境における最適方策学習に取り組むことが期待される.」である.モデルの構造だけでなく,それがグラフベース環境以外の環境にも適応可能なのか,また有効なのか,また,有効であれば従来手法と比較してどのような違いが出るのか非常に興味深い.
5件目は名古屋工業大学の村山らによる「受動的力学機序を規範とした2足ロボットの世界モデルと連続跳躍動作」[5]の発表である.本発表では,受動歩行由来の身体と環境との相互作用からなる受動的力学機序と世界モデルを融合し,2足ロボットを用いて,よりヒトに近い動作の獲得の実現を目的としている.筆者が興味を持った点は,「6.おわりに」の「身体の「知」と学習による「知」が巧く融合したのではないか」である.知能ロボットと比較すると,人間は少ない学習データで,高度な運動を可能にする知能・身体を有している.本研究を通して,そのような人間の高度な知能・身体の仕組みを解明していけるのではないかと感じている.
3. おわりに
本稿では,OS-21d:世界モデルと知能のセッションのレポートを行った.今回扱ったセッションに加え,JSAI2023では計6つの世界モデルと知能のセッションが開催されており,非常に注目を集めている分野であると感じた.ロボティクスに関連した研究も数多く発表されており,興味深いセッションであった.
参考文献
[1] 是方諒介,神原元就,吉田悠,石川慎太朗,川崎陽祐,髙橋正樹,杉浦孔明:“Switching Head-Tail Funnel UNITERによる対象物体および配置目標に関する指示文理解と物体操作”, 第37回人工知能学会全国大会予稿集, 2G4-OS-21d-01,2023.
[2] 青木瑞穂,藤重天真,塚本慧,藤本昌也,鈴木雅大,松尾豊:“世界モデルベースマルチエージェント強化学習におけるエージェント間の公平性を考慮した経路計画手法の提案”, 第37回人工知能学会全国大会予稿集, 2G4-OS-21d-02,2023.
[3] 五十嵐渓,村田 真悟:“多視点カメラ画像のゲート付き対照学習に基づく実ロボット行動生成”, 第37回人工知能学会全国大会予稿集, 2G4-OS-21d-03,2023.
[4] 河村和紀,池之内颯都,石川峻弥,村上綾菜,河野慎,松尾豊:“類似グラフ環境における事前知識を活用した方策学習のための世界モデル”, 第37回人工知能学会全国大会予稿集, 2G4-OS-21d-04,2023.
[5] 村山大騎,土方祥平,横地康太,田中翔麻,上村知也,佐野明人:“受動的力学機序を規範とした2足ロボットの世界モデルと連続跳躍動作”, 第37回人工知能学会全国大会予稿集, 2G4-OS-21d-05,2023.
土方祥平 (Shohei Hijikata)
2022年名古屋工業大学工学部電気・機械工学科卒業,同年名古屋工業大学大学院工学研究科工学専攻博士前期課程入学.受動的力学機序を規範とした2足ロボットに関する研究に従事.日本ロボット学会学生編集委員.