カーネギーメロン大学(CMU)の研究チームが、人が作業する様子を見て真似ることで体得するロボット、WHIRL(In-the-Wild Human Imitating Robot Learning)を研究開発しています。
このロボットは市販のロボットアームにカメラとAIアルゴリズムを追加したもので、一度カメラで見た人の動作を再現すべく、成功するまで繰り返しトライして体得します。実験では20種類以上の作業を覚えることができたとのこと。
研究チームがロボットに覚えさせたのは、いずれも家庭内におけるありふれた作業ばかり。たとえば引き出しやキャビネット、ドアの開け閉めから、鍋にフタをする動作、椅子を机の下に押し込む動作、ゴミ箱からゴミの入った袋を取り出す動作などで、作業対象となる物に改造などは施していません。
ロボットは最初に1度だけ、人がその動作をする様子を見せられます。そしてすぐに同じ事を、成功するまで実行します。たいていの場合、最初はのうちはだいたい失敗におわりますが、ロボットはへこたれることなく何度でもチャレンジし、幾度かの成功を経て、上手に作業をこなせるようになります。このとき、最終に習得した動作が人が見せたものとは異なる場合もありますが、ロボットはその骨格も可動範囲も人間とは異なるため、チームは動作そのものでなく、作業の結果がその目的を達成していれば良しとしました。
こうしたAIの学習方法は模倣学習と強化学習を組み合わせて実現されています。模倣学習は最初に人間がタスクの完了方法を教え、数回実行させて大まかな手順を覚えさせます。そして次にシミュレーションを用いて数百万回におよぶ強化学習を実行し、トレーニング内容を実世界に適応できるように調整します。
ただ、模倣学習と強化学習は、ロボットに繰り返し作業を教えることになるため、今回のロボットのようにたくさんの作業を教えるのが困難です。しかし、WHIRLの場合は、現場で人がお手本を見せるだけで、あとはひとつひとつ作業をロボットが自ら覚えていくことができ、迅速に複数の作業を身につけられるとのこと。
CMU Robotics InsutituteのDeepak Pathak氏は「この作品は家庭用のロボットを作る方法を示している」と述べています。「様々なタスクを正常に実行できるようあらかじめプログラムまたはトレーニングするのでなく、まずロボットを現場に持って行き、作業を見せるだけで、それを学習させ、環境に適応させ、自ら改善させることができる」と説明しています。
Pathak氏の言うように、WHIRLの技術がより高度になって行けば、われわれと同じように目で見て仕事を覚えていく、親しみやすいお手伝いロボットが、将来実現するかもしれません。
チームは、ニューヨークで6月27日から7月1日まで開催されたRobotics:ScienceandSystemsカンファレンスで、この研究を発表しました。