【ダイジェスト】
新しいシステム「OK-Robot」が、ロボットが初めて訪れる家庭内で物を拾って移動させる訓練を可能にします。このシステムは、追加の高価で複雑な訓練を必要とせず、急速に進化するAIモデルと実際のロボットの能力との間のギャップを埋めるかもしれません。ニューヨーク大学とMetaの研究者たちは、Hello Robot社が製造する「Stretch」という商用ロボットを使用し、5つの家庭の合計10の部屋でテストを行いました。研究者がiPhoneアプリ「Record3D」を使用して部屋の3Dビデオを撮影し、そのデータをロボットと共有します。OK-Robotシステムは、このビデオのフレームにオープンソースのAIオブジェクト検出モデルを適用し、おもちゃのドラゴンや歯磨き粉のチューブ、トランプのパックなどの物体や、椅子、テーブル、ゴミ箱などの場所を識別しました。その後、ロボットは特定のアイテムを拾って新しい場所に移動させるよう指示され、58.5%のケースで成功しました。部屋が散らかっていない場合、成功率は82%に上昇しました。
この研究はまだ査読されていませんが、Google DeepMindのシニアコンピュータビジョン研究科学者であるMatthias Minderer氏(プロジェクトには関与していない)は、オープンソースのAIモデルとツールを活用することの重要性を指摘しています。一方で、ニューヨーク大学のコンピュータサイエンス助教授であるLerrel Pinto氏は、オープンソースモデルの使用が持つ利点と限界について言及しています。具体的には、追加の訓練データをロボットに与える必要がない一方で、ロボットができるのは物を拾って別の場所に置くことだけであり、引き出しを開けるような動作はできないと述べています。
このプロジェクトを共同で主導したニューヨーク大学のPhD学生であるMahi Shafiullah氏は、OK-Robotを音声認識モデルと組み合わせることで、研究者がロボットに対して音声で指示を出しやすくなると述べています。彼は、家庭内でのロボットの使用が不可能だと考える人が多い中で、この研究がその可能性を示す一歩になると考えています。
【ニュース解説】
新しいシステム「OK-Robot」が開発され、ロボットが初めて訪れる家庭内で物を拾って移動させることが可能になりました。この技術は、追加の高価で複雑な訓練を必要とせずに、AIモデルの進化と実際のロボットの能力のギャップを埋めることを目指しています。ニューヨーク大学とMetaの研究者たちが、商用ロボット「Stretch」を用いて5つの家庭の10の部屋でテストを行い、iPhoneアプリ「Record3D」を使用して部屋の3Dビデオを撮影し、そのデータをロボットと共有することで、ロボットが部屋内の物体や場所を識別できるようにしました。
このシステムの利点は、オープンソースのAIモデルを活用することで、追加の訓練データをロボットに与える必要がない点にあります。しかし、その反面、ロボットができるのは物を拾って別の場所に置くことだけであり、より複雑な動作はできないという限界もあります。このプロジェクトでは、音声認識モデルとの組み合わせにより、研究者がロボットに対して音声で指示を出しやすくすることも検討されています。
この技術の開発は、家庭内でのロボットの使用が現実的になる可能性を示しています。これまで、家庭内でのロボットの使用は多くの人にとって難しいと考えられてきましたが、OK-Robotのようなシステムによって、ロボットが日常生活の中で役立つようになる日が近づいているかもしれません。
しかし、この技術にはいくつかの課題もあります。例えば、ロボットが指示された物体を見つけられない場合、解決策を見つけ出す代わりに動作を停止してしまうという問題があります。また、部屋が散らかっていると成功率が下がるため、実際の家庭環境での使用にはさらなる改善が必要です。
長期的には、このようなシステムの発展によって、ロボットがより複雑なタスクをこなし、人間の生活をサポートする存在になることが期待されます。しかし、そのためには、ロボットの認識能力や動作の正確性をさらに向上させる必要があります。また、プライバシーや安全性の問題も考慮する必要があり、これらの技術が社会に受け入れられるためには、これらの課題に対する解決策を見つけることが重要です。
from This robot can tidy a room without any help.

