AI・ロボットビジョンの基礎と実応用から生成系AI利用ロボット研究の最前線~2D/3D物体認識の基本技術と実用例紹介から、生成系AI利用によるAI知能化ロボット研究の展望まで~[日刊工業実務セミナー]
【開催概要】
◇ 開催日:2026年 6月 22日(月)13:00~17:00 ※後日の録画視聴も可能
◇ 会 場:オンライン(ZOOM)
◇ 申込URL:https://corp.nikkan.co.jp/seminars/view/7853
【開催趣旨】
本講座は、Amazon Robotics ChallengeやWorld Robot Summit(WRS)などの国際大会で世界第3位・優勝し、関連する国家プロジェクト等にも参画実績を持つ講師が、ロボットAI適用の中核をなすロボットビジョン(視覚)の基礎的技術に加え、工場や大規模配送センターへの適用事例、さらには最近注目度が高まっている生成系AIを利用したロボット関連の最先端技術を、4時間集中でわかりやすく解説します。
物体認識手法については、2D/3D両面でのセンシングと認識アルゴリズムについて、いまでも主流となっている基本的な技術と、最近の機械学習ベースの手法を解説します。また、これらの技術の実用事例については、いくつかのロボット国際大会で実際に活用した技術を中心に、ノウハウを含めて紹介します。
さらに、近年急 速に発展している大規模AIモデル(LLM/VLM)を活用した最先端のロボット知能化研究に焦点を当てます。講師が長年研究しているお茶会ロボットを例に、人間のように動作するロボット開発がなぜ難しいのか、その本質的な課題を整理するとともに、その解決を目指した技術として、道具の「機能認識」を用いた動作手順の自動修正や動作軌跡の最適化、LLMによる行動計画、VLMを利用した調理タスクモニタリング、さらには簡単な命令を与えるだけで技術者に代わってロボットプログラムを自動生成する研究事例などをふんだんな画像や動画を交えて丁寧に解説し、AIロボットの展望を提示します。
【講 師】
中京大学 大学院 工学研究科長、機械システム工学専攻 教授 橋本 学 氏
【プログラム】
1.イントロダクション:AI応用ロボットの概要
1-1 AI・ロボットの主な利用分野と課題整理
1-2 ロボットビジョンの基本構成
2.モノを観る:物体認識の基本技術とAI利用の先端技術
2-1 物体認識アルゴリズムの基礎(概要と2D/3D的アプローチの分類と特徴)
2-2 2D物体認識技術の基本技術と先端技術
2-2-1 2D物体認識アルゴリズムの基礎(2D的アプローチ:タイプA)
((1)キーポイント特徴量:SIFTなど/(2)画素:テンプレートマッチング/(3)図形の輪郭や幾何学的モデルの利用
2-2-2 2D物体認識アルゴリズムの実用技術・最新技術(戦略的画素選択に基づくテンプレートマッチング)
(独自性、照明変動耐性、識別性能などに着目した画素選択の戦略と性能)
2-2-3 2D物体認識アルゴリズムの最前線
(2D的アプローチ:機械学習ベース タイプB)
(特徴点ベース:SuperPoint, SILK, LoFTRなど)
(局所領域ベース:YOLOシリーズ、DINO, Grounding DINOなど)
(領域セグメンテーションベース:Mask R-CNN, SAMなど)
2-3 3D物体認識技術の基本技術と先端技術
2-3-1 3次元センサのありがたみと3次元計測の分類・原理
(三角測量 vs. 同軸測量、パッシブセンサ vs. アクティブセンサ)
2-3-2 市販3次元センサの状況と分類(光学センサ)
(見えにくい対象物:金属、黒色、透明、小型に対する計測結果と考察)
2-3-3 ポイントクラウドデータの基本構造(3次元点群)
2-3-4 3D物体認識アルゴリズムの基礎
(3D的アプローチ:タイプC/D)
(アピアランスベース物体認識 vs. モデルベース物体認識)
2-3-5 3Dキーポイントマッチングと2つのタイプの3次元特徴量
(SHOT特徴量、PPF特徴量など)
3.ロボットビジョンの実用技術
3-1 柔軟な動作のためのロボットビジョン
3-1-1 プリミティブ形状近似によるモデルレス把持位置決定
(円柱、球、平板、直方体への近似による把持パターンDBの利用)
3-1-2 ピッキングリスク最小化に基づく動作生成
(掴みやすさ、静的・動的クリアランスの3つの余裕度による総合把持余裕度推定モデル)
3-2 ロボット国際大会にみる実用ロボットビジョン
3-2-1 物流分野:Amazonチャレンジ関連技術
(Amazon Robotics Challengeの概要と目的)
(第1回~第3回大会における技術開発事例と得られた教訓)
(アイテムの多様化、認識・把持の難しさ、ルールの変化)
(VPMアルゴリズムによる認識、ハンド・センサの構成)
3-2-2 製造分野: World Robot Summit:WRS
(WRSの課題,開発技術例)
4.ロボット知能化研究の最前線(LLM/VLMと機能認識を用いた上位行動プラン生成と動作軌跡生成)
4-1 汎用知能ロボットの課題‥‥お茶会ロボットはなぜ難しいのか?
(記号/言語レイヤーと物理レイヤーの接続)
4-2 記号レイヤーでの行動プラン生成
4-2-1 予備検討とLLMの登場
4-2-2 LLMは本当に使えるのか?
4-2-3 【機能】を利用した手順のエラー修正
(LLMによる行動プラン生成の可能性と問題点の分類と解決の方向性)
4-3 物理レイヤーへの接続
4-3-1 道具の機能認識とAffordance
4-3-2 機能情報を用いたLLM生成手順の自動修正
4-3-3 共通動作軌跡モデル
4-3-4 定量すくい動作の生成
4-3-5 環境に存在する事物との干渉問題の解決
(タスク達成余裕度予測による物理的に実行可能な軌跡の決定)
4-3-6 VLM(視覚言語モデル)を利用したタスクモニタリング
(CLIPを活用した調理完了タイミングの決定)
4-3-7 生成AIを用いたロボットプログラム自動生成
(成功事例と失敗事例の分析)
5.今後の展望とまとめ・質疑応答
5-1 Amazon Robotics Challengeのその後
5-2 ロボット動作生成に関する最新の研究動向
(Google等のLLM-VLM-Policy融合モデル:RT-X、Gemini Roboticsなど)
5-3 主なヒューマノイドロボットの動向
(Altas、Figure、Optimus、Digit等)
5-4 まとめ・質疑応答
配信元・問合先――――――――――――――――――――――――――――
今堀崇弘
株式会社日刊工業新聞社
t.imahori@nikkan.press
0669463384
