2023/02/03学生編集委員会企画：第40回日本ロボット学会学術講演会レポート（OS16：確率ロボティクスとデータ工学ロボティクス〜認識・行動学習・記号創発〜（1/4））

1. はじめに

本稿では，2022年9月5日から9日にかけて東京大学にて開催された第40回日本ロボット学会学術講演会のレポートを行う．レポート内容は，9月5日に行われたOS16：確率ロボティクスとデータ工学ロボティクス〜認識・行動学習・記号創発〜（1/4）を扱う．

1.1 オーガナイズドセッションについて

本オーガナイズドセッションは、「実世界理解やヒューマンロボットインタラクションにおける，統計的機械学習の基盤技術および実世界データの利活用について議論する」ことを目的としたセッションである．またOS16は期間中4つのセッションに分かれている．本セッションはそのうちの1つであり、全7件の発表で構成される．

2. 発表内容

2.1 マルチモーダル情報の統合に基づく世界モデル

1件目は，パナソニックコネクトの黄瀬さんらによる「マルチモーダル情報の統合に基づく世界モデル」[1]である．本発表は，モダリティの潜在状態の統合分布について，Mixture of Products of Experts(MoPoE)やMixture of Experts(MoE)を組み合わせることで，新たな世界モデルを作成した研究である．また実験では，複数のモダリティを統合させたときに生じるテスト時のモダリティ欠損に対して，ロバスト性を確認できたとする．本発表で筆者が興味をもったのは，論文「5. おわりに」内にある「良い表現」や，質疑応答時の「人間はモダリティを取捨選択しており，今後の課題としてそのような機構をつくる」という点である．マルチモーダル情報を統合させたときの「良さの評価」をどのように行うかが気になった．ヒトは生きているなかで無意識に多くのモダリティから情報を受け取っており，なにを根拠に情報を選択し，どの要素を良い情報と評価しているのかは自分たちすらもわからない．そのような中でどのように良さの評価を決め，モダリティの表現の良さを決めるのかが興味深かった．

2.2 脳の階層的な言語獲得のシミュレーション研究

2件目は，早稲田大学の小島さんらによる「脳の階層的な言語獲得のシミュレーション研究」[2]である．本研究は，脳の計算理論の一種である予測符号化理論に基づいた再帰型神経回路モデルの構築を提案した．また実験では，感覚運動統合達成時の情報処理プロセスを解析することで，脳内における階層的な言語獲得の仕組みを説明している．本発表で筆者が興味をもったのは，階層ごとで言語処理内容が異なる点である．本研究内の解析では，上の層から順に文章全体の意味の抽出，感覚運動統合，各モダリティの感覚処理が行われていると確認している．また論文内「6.考察」において，slow層，association層，fast層のそれぞれをヒト脳の部位に関連させて述べている．ここで本研究のように3層という少ない層数のモデルを、ヒト脳の役割に当てはめてよいのかという点と，もし層数を増やした場合では各層での処理の違いが詳細にあらわれるのか気になった．

2.3 一般化多感覚相関モデル学習に基づく身体図式の獲得と認識制御

3件目は，東京大学の河原塚さんらによる「一般化多感覚相関モデル学習に基づく身体図式の獲得と認識制御」[3]である．本研究は，多感覚相関性・汎用性・自律獲得性・変化適応性をもつ身体図式モデルの獲得を目的としている．また実験として，複数種類のロボットを用いた実験を行い，幅広いロボットへ適用が可能であることを確認している．本発表で筆者が興味をもったのは，論文「4．結論」にある，「提案された身体図式モデルが単純な道具先端操作から筋骨格モデル, 低剛性樹脂製ヒューマノイドの全身運動まで幅広く適用可能」という点である．今後ロボットが普及する社会になることが予想される中で，どのような形でロボットに搭載し，どのようなことを目的とした支援を想定しているのか気になった．またいろいろな技術と組み合わせることで，自律型ロボットがより一般的になるように感じ，とても興味深かった．

2.4 フェヒナーの法則に従う強化学習則の挙動解析

4件目は，奈良先端科学技術大学院大学の高橋さんらによる「フェヒナーの法則に従う強化学習則の挙動解析」[4]である．本研究は，報酬設計に関する一般性を保持したまま近似を回避するような新たな強化学習モデルを提案している．また新たに導出された学習則は，刺激強度に対する人間の感覚量を示した式であるフェヒナーの法則に沿う．実験では，フェヒナーの法則に沿った学習則がもたらす影響をシミュレーションによって調査した．本発表で筆者が興味をもったのは，報酬関数に罰の価値関数を導入した点である．人間と報酬の関係について考えてみると，報酬がプラスであればより報酬が良くなるような働きをし，罰があればその罰を避けるような働きをする，ことは容易に想像できる．その中である程度の罰を受け入れなければならない状況も現実問題としては考えられるだろう．あえて損を取らなければならないような場合のシミュレーションの解釈について気になった．

2.5 個々の目的を持つマルチエージェント強化学習における多目的最適解の検証

5件目は，明治大学の青谷さんらによる「個々の目的を持つマルチエージェント強化学習における多目的最適解の検証」[5]である．本研究は，強化学習の報酬をスカラー化し，所得の不平等さを測る指標であるジニ係数を罰則項として与えることで，報酬の平等性を考慮した集団行動を得る報酬成形手法を提案している．また実験では数値シミュレーションを用いて，さまざまな目的に対する重みを考慮した平等性の高い集団行動を獲得できることを示している．本発表で筆者が興味をもったのは，「平等性の高い集団行動」という点である．強化学習に着目すると，一般的に報酬が最も高くなるような学習が重要になると考えられる．しかしロボットが複数あるような集団行動を想定した場合，全体的に高い報酬を得られるような平等性のある行動が必要になるだろう．また今後複数のロボットが人間の代わりに働くことが想定される状況のなかで，ロボットにも協調性のような考え方が必要になるのだろうと感じた．

2.6 サンプリングベースモデル予測制御における棄却サンプリングの検証

6件目は，国立情報学研究所の小林さんらによる「サンプリングベースモデル予測制御における棄却サンプリングの検証」[6]である．本研究は，良い結果を導く分布と悪い結果を引き起こす分布を分け，個別に更新することで2つの分布を統合する手法を提案している．また実験では，数値シミュレーションから他の手法が苦手なタスクに対して，提案手法は安定した制御性能があることを示した．本発表で筆者が興味をもったのは，結果の分布を2つに分ける仕組みについてである．従来であれば1つの分布から対策を考えようとしてしまいそうだが，その点を柔軟に対応した解決策であるように感じた．また悪い結果になるのは「なぜその条件だと悪くなるのか」というような，具体的な状況についても分布から解析できるのか気になった．そしてリアルタイム性や精度をあげることと，計算コストの双方をバランスよく考える必要がある点についても興味深かった．

2.7 UAVにより取得したブレのあるコンクリート構造物画像の鮮鋭化のための一次元方向ブレ量同定

7件目は，筑波大学の林さんらによる「UAVにより取得したブレのあるコンクリート構造物画像の鮮鋭化のための一次元方向ブレ量同定」[7]である．本研究は，UAV（ドローン）などにより取得したコンクリートなどのブレ量の同定を行い,インフラ構造物の点検に必要なコンクリートのひび割れといった損傷を確認しやすくする手法を提案している．また実験では，実際のコンクリート画像をUAVを用いて撮影をし，劣化画像から実際のひび割れの部分を抽出できることを確認した．本発表で筆者が興味をもったのは，従来のUAVを用いた画像だと撮影条件によってはひび割れが正確に抽出できない可能性があるということである．技術が進むことでカメラや画像処理技術が発展し，周辺技術によってひび割れなどは比較的容易に抽出できると思っていた．しかし，ドローンをはじめとするUAVなどは細かな揺れも含め全ての画像を鮮明に取得するわけではない．そのため本発表のような手法はインフラ等の点検支援にとても役立つだろうと感じた．

3. おわりに

本稿では，OS16：確率ロボティクスとデータ工学ロボティクス〜認識・行動学習・記号創発（1/4）の様子をお伝えした．筆者自身の研究にも関連する内容が多くあり，今後の参考になる発表ばかりだった．また人間とロボットが共存する世界が増える可能性を考えると，ロボットなどの認識や行動に着目した研究がより重要になるだろう．

参考文献

[1] 黄瀬輝，奥村亮，岡田雅司，谷口忠大："マルチモーダル情報の統合に基づく世界モデル"，日本ロボット学会第40回学術講演会予稿集，1F1-01，2022．
[2] 小島知将，出井勇人，尾形哲也，菅野重樹："脳の階層的な言語獲得のシミュレーション研究"，日本ロボット学会第40回学術講演会予稿集，1F1-02，2022．
[3] 河原塚健人，岡田慧，稲葉雅幸："一般化多感覚相関モデル学習に基づく身体図式の獲得と認識制御"，日本ロボット学会第40回学術講演会予稿集，1F1-03，2022．
[4] 高橋慶一郎，小林泰介，松原崇充："フェヒナーの法則に従う強化学習則の挙動解析"，日本ロボット学会第40回学術講演会予稿集，1F1-04，2022．
[5] 青谷拓海，小林泰介，小澤隆太："個々の目的を持つマルチエージェント強化学習における多目的最適解の検証"，日本ロボット学会第40回学術講演会予稿集，1F1-05，2022．
[6] 小林泰介，青谷拓海："サンプリングベースモデル予測制御における棄却サンプリングの検証"，日本ロボット学会第40回学術講演会予稿集，1F1-06，2022．
[7] 林利行，坪内孝司："UAVにより取得したブレのあるコンクリート構造物画像の鮮鋭化のための一次元方向ブレ量同定"，日本ロボット学会第40回学術講演会予稿集，1F1-07，2022．

黒田彗莉（Eri Kuroda）

2022年お茶の水女子大学大学院人間文化創成科学研究科博士前期課程修了．修士(理学)．現在，同研究科博士後期課程在学中．日本学術振興会特別研究員（DC1）．人工知能学会学生編集委員．人工知能，機械学習などを用いたヒトの実世界理解についての研究に従事．