日本のロボット研究の歩みHistory of Robotics Research and Development of Japan2008Integration, Intelligence, etc.〈インテグレーション・知能ほか〉ロボット聴覚オープンソースソフトウェア HARK (Honda Research Institute Japan Audition for Robots with Kyoto University) の研究開発と展開
中臺 一博 | (株) ホンダ・リサーチ・インスティチュート・ジャパン |
山本俊一 | 京都大学 |
奥乃 博 | 京都大学 |
バラン ジャンマルク | シェルブルック大学 |
中島 弘史 | (株) ホンダ・リサーチ・インスティチュート・ジャパン |
武田 龍 | 京都大学 |
中村 圭佑 | (株) ホンダ・リサーチ・インスティチュート・ジャパン |
吉田 尚水 | 東京工業大学 |
水本 武志 | 京都大学 |
大塚 琢馬 | 京都大学 |
この論文は、ロボット研究開発アーカイブ「日本のロボット研究開発の歩み」掲載論文です。
HARK (Honda Research Institute Japan Audition for Robots with Kyoto University) は,2000年から始まったロボット聴覚研究の成果をオープンソースソフトウェアとして2008年4月に公開した.複数のマイクロホンからなるマイクロホンアレイを用いて,実時間で音源の方向推定(音源定位),特定の方向の音の分離抽出(音源分離),分離した音の認識(分離音音声認識)の3つの機能を柱とするソフトウェアである.ソフトウェア的な視点からは,信号処理や音声処理に対する十分な知識がない人でもできるだけ手間をかけず利用できるようなユーザフレンドリ設計,および机上だけでなく,実ロボットにそのまま搭載して利用できるようなオンライン実時間処理設計という2つの設計思想の下,開発を行った.前者については,グラフィカルユーザインタフェースを用いたプログラミング機能,容易なインストール,300頁を超えるマニュアルやレシピといった充実したドキュメントの完備,入力から認識まで一気通貫の機能モジュールの提供,Windows や Linux など複数のプラットフォームでの実行環境の提供を行っている.後者に関しては,入手しやすいマルチチャネルのオーディオ用 A/D 装置のサポート,実時間高性能信号処理アルゴリズムの積極的な提供,ロボット用ミドルウェア ROS とのシームレスな統合を行っている.HARK の有用性は,聖徳太子を超える11人の同時発話認識を始めとした様々なデモによって示されている.
2008年以降,年1回ペースでバージョンアップを続けており,リリースと同時に国内外で無料講習会を開催するなどして啓蒙活動を行っている(2015年6月現在で,計8回のリリースと計11回の講習会を開催した).また,メールベースでのサポートも行っており,これまでにダウンロード数は,世界中から 5 万回以上となっている.近年では,動物行動学や極限音響といった方面への展開も見られ,技術的,適用領域的にも展開を見せている.
2014年 第19回日本ロボット学会実用化技術賞受賞
IEEE/RSJ IROS 2001 Best Paper Award Finalist in 2007.
IEA/AIE The Best Paper Award in 2010.
リンク:Willow Garage社でのHARKの適用活動