執筆日 2020年12月1日
東京大学 工学系研究科 修士1年 小嶋 麻由佳
2020年10月9日から11日にかけてオンライン開催された日本ロボット学会第38回学術講演会のセッション参加レポートをお届けします.ロボット学会初のオンライン開催ということで,直接先生方にお会いできなかったのは残念でしたが,スライド等はむしろ見やすく,快適でした.
今回レポートするのは,10月9日から10日にかけて開かれた「確率ロボティクスとデータ工学ロボティクス~認識・行動学習・記号創発~」というセッションです.最先端のロボットのモデルに関する研究発表が5セッションに跨って29件も行われました.今回は,その中でも3セッション目の6件についてレポートします.全体的に,「機械学習」を用いた研究が多かったです.また,ヒトに関連した研究が多く,興味深く聞かせていただきました.
順番にプログラムを紹介します.
1件目は東京大学と東北大学とRIKEN AIPのグループによる「Semantic Mapping of Construction Field」.上空画像から地上の建物や車両などの情報を分類していました.分類結果が分かりやすく画像に表されていて良かったです.また,この分類によって車両などの動きうるものと建物などの動かないものを分けることで動作計画などを立てる時の役に立ちそうだと思いました.
分類の様子.(予稿原稿[1]より転載)
2件目は,大阪大学と電気通信大学のグループによる「人の身体を基盤とした認知モデルの構築の試み」です.ヒトの感覚は外受容感覚・固有感覚・内受容感覚の3種類に分けられるそうです.しかし,現状では人間の内受容感覚を再現できていないらしいのですが,Sensoroidという様々なセンサが搭載されているツールを開発してデータを取得することで,内受容感覚をも含めたヒトの認知モデルを構築しようとしているとのことです.
Sensoroidの全体図と取得されたデータ.(予稿原稿[2]より転載)
3件目は,大阪大学と電気通信大学のグループによる「マルチモーダル世界モデルを用いた実ロボットによる言語的思考の実現」です.ヒトは物事を考える際に言語を利用しており,言語を用いることで複雑な世界を抽象的に表現しています.このグループは,このような言語入力から文法をロボットに学ばせ,意味を推定させたそうです.この分野に余り詳しくないのでわからないのですが,このような言語的推論に基づくロボットが従来手法のものより人間的な思考をできるようになったりすれば面白いと思いました.今後の研究に期待したいです.
ロボットの言語を含むマルチモーダル世界モデル.(予稿原稿[3]より転載)
4件目は,奈良先端科学技術大学院大学のグループによる「FPGAを用いた実時間ロボット制御のための深層強化学習手法Binary P-Networkの提案」です. DCNN手法を小さなロボットでも使えるように小規模化したBinary P-Networkを提案していました.従来手法に二値化とGIOを加えることでこのような小規模化と高い学習性能を実現したそうです.
実験の様子.(予稿原稿[4]より転載)
5件目は,国際電気通信基礎技術研究所と奈良先端科学技術大学院大学のグループによる「形態の異なるロボット間での敵対的生成模倣学習」です.敵対的模倣学習では,熟練者と学習者の差異を報酬として学習者の動きを熟練者の動きに近づけるとのことです.この手法を用いると,2リンク機構で学習したモデルを用いて4リンク機構の制御を行えるらしく, 驚きました.また,どの程度熟練者の動きに近づいているのかを定量的に出せることは,スポーツなどの練習にも応用できそうで興味深く思いました.
6件目は,早稲田大学と産業技術総合研究所による「触覚に導かれた好奇心モデルが創発させる物体志向行動」です.ヒトの幼児は好奇心に導かれ,触覚の反応を楽しんでいるかのように周囲の環境を探索しているそうです.そこで,好奇心に基づいて,触覚に関して新規性が高い状況に高い報酬をロボットに与えたところ,物体志向動作が見られたとのことです.新規性を報酬とした時に物体と触れ合う作業をしようとするというのは,理にかなっていてとても興味深く思いました.また結果により,身体上の触覚情報の分布によりロボットの動作を誘導できることも示唆されたらしく,今後の研究に期待したいです.
実験環境.(予稿原稿[6]より転載)
以上で「確率ロボティクスとデータ工学ロボティクス~認識・行動学習・記号創発~(3/5)」のセッションレポートを終わります.この他にも,「視覚・触覚に基づくロボットマニピュレーション」「ヒューマンインタラクション(2/2)」「ヒューマン・マシン・インターフェース」のセッションについてもレポートしていますので,そちらも是非御覧ください.
【講演プログラム】
1C3_OS08:確率ロボティクスとデータ工学ロボティクス~認識・行動学習・記号創発~(3/5)
[1] 1C3-01 Semantic Mapping of Construction Field
○Thomas Westfechtel(Univ. of Tokyo),Kazunori Ohno(Tohoku Univ./RIKEN AIP),Tatsuya Harada(Univ. of Tokyo),Satoshi Tadokoro(Tohoku Univ.)
[2] 1C3-02 人の身体を基盤とした認知モデル構築の試み
○大森 一祥(大阪大学),宮澤 和貴(大阪大学),堀井 隆斗(大阪大学),長井 隆行(大阪大学/電気通信大学)
[3] 1C3-03 マルチモーダル世界モデルを用いた実ロボットによる言語的思考の実現
○宮澤 和貴(大阪大学),青木 達哉(大阪大学),堀井 隆斗(大阪大学),長井 隆行(大阪大学,電気通信大学)
[4] 1C3-04 FPGAを用いた実時間ロボット制御のための深層強化学習手法Binary P-Networkの提案
○角川 勇貴(奈良先端科学技術大学院大学),鶴峯 義久(奈良先端科学技術大学院大学),松原 崇充(奈良先端科学技術大学院大学)
[5] 1C3-05 形態の異なるロボット間での敵対的生成模倣学習
○内部 英治(国際電気通信基礎技術研究所),松原 崇充(奈良先端科学技術大学院大学),森本 淳(国際電気通信基礎技術研究所)
[6] 1C3-06 触覚に導かれた好奇心モデルが創発させる物体志向行動
○増田 真之(早稲田大学),森 裕紀(早稲田大学/産業技術総合研究所),尾形 哲也(早稲田大学/産業技術総合研究所)