SEARCH
MENU

ロボットのための画像処理技術(実施報告)


日本ロボット学会  第126回 ロボット工学セミナー

ロボットのための画像処理技術

日時:2020年5月22日(金)10:00~17:00

会場:遠隔配信

参加者数:189名

オーガナイザー:牛久祥孝(OSX / Ridge-i)

サブオーガナイザー:竹村憲太郎(東海大学)

 

セミナー概要

 より知的なロボットを実現するためには,高度な環境認識と行動生成の技術が求められます.環境認識においては,深層学習をはじめとする機械学習分野と視覚データを主に扱うコンピュータビジョン分野での発展が著しく,ロボット工学分野と一体となって急速に研究が進んでいる状況です.

 本セミナーでは,深層学習を活用した画像理解を軸として,ロボットにとって重要な技術である3次元空間としての認識認識も含めた広範な画像処理技術についてのチュートリアルを実施いたしました.深層学習による画像認識から3次元空間における点群としての環境理解や自己位置推定及びマップ生成など,それぞれ第一線の研究者にご講演頂きました.

 

第1話 画像認識と深層学習

Mobility Technologies 内田 祐介 様

  2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては深層学習,その中でも特に畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなっています.CNNはクラス分類をはじめとして,物体検出やセグメンテーションなど様々なタスクを解くためのベースネットワークとして広く利用されています.

 この講演では,CNNの発展を重要なモデルの紹介を交えて振り返るとともに,そうしたモデルの自動設計を目的とするNeural Architecture Searchのご紹介を頂きました.その次にエッジデバイスで動作させる際に重要となる計量モデルや種々の高速化手法について触れ,クラス分類以外にも物体検出や領域分割,姿勢推定などへの応用についてご解説頂きました.また最後には,機械学習コンペティションプラットフォームであるKaggleの紹介やコツについてのレクチャーもありました.

 

第2話 IMUを用いた自己位置推定

九州大学 内山 英昭 先生

 Inertial Measurement Unit(IMU)とは,加速度と角速度を計測可能なセンサです.今日ではスマートフォンに搭載され,加速度の変化から歩数をカウントするアプリなどに用いられています.IMUを用いた自己位置推定技術はInertial Navigation System(INS)と呼ばれ,飛行機などの様々な移動体測位に用いられています.

 この講演では,IMUを用いた自己位置推定に繋がる一連の研究として,Visual SLAMの原理やナビゲーションに関するコンペティションへの取り組みをご紹介頂いた後に,実際のIMUを用いた自己位置推定技術についての研究事例をご解説頂きました.

 

第3話   Visual SLAMと深層学習を用いた3Dモデリング 

産業技術総合研究所 櫻田 健 様

  Visual SLAMはロボティクスやAR/VRを目的に世界中で活発に研究が行われています.Structurefrom Motion (SfM)と比較して,Visual SLAMではリアルタイムにカメラ姿勢と3次元形状を推定するため,計算量を削減する様々な工夫が施されています.さらに,深層学習の発展に伴い,単眼画像から奥行きを推定し,その結果をVisual SLAMに応用する研究なども盛んに行われれています.

 この講演では,まず事例として画像から3次元空間やさらにその時間的変化をモデリングする複数の研究をご紹介頂きました.その後,Structure from Motionの解説を経て講師の櫻田様のグループで開発を進めているVisual SLAMのオープンソースソフトウェア"OpenVSLAM"を例に,理論と実用の両面からVisual SLAMの解説を頂きました.

 

第4話  3次元点群と深層学習

早稲田大学 / オムロンサイニックエックス 千葉 直也 様

 三次元点群とは,空間中に分布する点の集合によって空間や物体の立体形状を表現するデータ構造です.PointNet / DeepSets以降,三次元点群を深層学習によって取り扱う手法が様々提案されています.

 この講演では,ニューラルネットワークの入出力として三次元点群を用いるための基本的なアイデアと三次元点群を処理するPointNetなどの代表的なネットワークをまずご紹介頂きました.画像のためのCNNでも行われているような階層的な処理を行うためのサブサンプリング手法や高速化手法の解説の後,こうした点群データを生成するような機械学習手法についてもご解説されました.また最後には,位置合わせや物体検出,形状補完などの応用例への言及もありました.

 

まとめ

 このセミナーの前の第125回から,ロボット工学セミナーでは新型コロナウィルスの影響で完全オンラインでのセミナーを提供しております.もともと現地聴講とwebexを用いた遠隔聴講を組み合わせた形式でセミナーをご提供してきているので,配信についての一定のノウハウはあったといえます.一方で,講師の先生方も遠隔で講演されること,現地で質問を受け付ける代替手段を検討する必要があったことなど,完全オンライン開催に伴ってより一層の検討と試行を繰り返しているところもあります.

 今回は特に,質問を受け付ける方法としてsli.doを試してみた回でもあります.匿名で質問できることや,他の聴講者の質問で自分も気になる質問には「いいね」を押すことでよりその質問に答えてほしいという意思表示が可能なことなど,現地開催では逆にできないような体験も可能です.アンケートでもこのsli.doを用いた取り組みは好評を頂けたようで,引き続きより良いQAの在り方を模索していければと思います.一方で,やはり回線の品質に伴う講演聴講の体験クオリティを中心に課題も見られ,継続的に改善案を検討する必要があると感じました.

 

謝辞

 それぞれの分野を代表する研究者の方々に,ご多用のところご快諾の上ご講演を頂いたことにまず感謝申し上げます.またこのセミナーにご参加頂いた参加者の皆様,質疑やアンケートに積極的にご参加頂いた皆様にお礼申し上げます.事業計画委員会の委員の皆様,サブオーガナイザーの竹村先生にも本セミナーの企画についてお力添えを頂きましてありがとうございます.東京大学の白藤先生および西川先生には,オンライン開催を決定する直前まで東京大学の会議室のご手配でお手数をおかけしました.また最後に,ロボット学会事務局の皆様にはセミナーの円滑な運営のために並々ならぬサポートを頂きました.感謝申し上げます.

2020年7月30日

文責 牛久祥孝(OSX/Ridge-i)