banner
Nachrichtenzentrum
Personalisierte Bestellungen sind immer erwünscht

Erziehung einer 3

Jul 15, 2023

Menschen sind soziale Wesen und lernen schon in jungen Jahren voneinander. Säuglinge beobachten ihre Eltern, Geschwister oder Betreuer aufmerksam. Sie beobachten, imitieren und wiederholen, was sie sehen, um Fähigkeiten und Verhaltensweisen zu erlernen.

Die Art und Weise, wie Babys lernen und ihre Umgebung erkunden, inspirierte Forscher der Carnegie Mellon University und Meta AI dazu, eine neue Methode zu entwickeln, um Robotern beizubringen, mehrere Fähigkeiten gleichzeitig zu erlernen und sie für die Bewältigung unsichtbarer, alltäglicher Aufgaben zu nutzen. Die Forscher machten sich daran, einen Roboter-KI-Agenten mit Manipulationsfähigkeiten zu entwickeln, die denen eines dreijährigen Kindes entsprechen.

Das Team hat RoboAgent angekündigt, einen Agenten für künstliche Intelligenz, der passive Beobachtungen und aktives Lernen nutzt, um es einem Roboter zu ermöglichen, Manipulationsfähigkeiten zu erwerben, die denen eines Kleinkindes ebenbürtig sind.

„RoboAgent ist ein entscheidender Meilenstein auf dem Weg zu allgemeinen Roboteragenten, die effizient lernen, in neuartigen Situationen effektiv sind und in der Lage sind, ihr Verhalten im Laufe der Zeit zu erweitern“, sagte Vikash Kumar, Lehrbeauftragter an der Fakultät für Informatik (öffnet sich in neuem Fenster) für Robotik Institut(öffnet neues Fenster). „Aktuelle Roboter sind hochspezialisiert und für einzelne Aufgaben isoliert ausgebildet. Im Gegensatz dazu haben wir uns zum Ziel gesetzt, einen einzigen Agenten für künstliche Intelligenz zu entwickeln, der in der Lage ist, in unsichtbaren Szenarien ein breites Spektrum an Fähigkeiten zu zeigen. RoboAgent lernt wie menschliche Babys – indem es eine Kombination aus reichlich passiven Beobachtungen und begrenztem aktivem Spielen nutzt.“

RoboAgent kann 12 Manipulationsfähigkeiten in verschiedenen Szenen ausführen. Diese Forschung weist auf eine robotische Lernplattform hin, die an sich ändernde Umgebungen angepasst werden kann. Im Gegensatz zu früheren Forschungen demonstrierte das Team seine Arbeit in realen Umgebungen – nicht in Simulationen – und tat dies mit weit weniger Daten als bei früheren Projekten.

„RoboAgents verfügen über weitaus komplexere Fähigkeiten als andere“, sagte Abhinav Gupta (öffnet neues Fenster), außerordentlicher Professor am Robotics Institute. „Wir haben eine größere Vielfalt an Fähigkeiten gezeigt als alles, was jemals ein einzelner Roboteragent in der realen Welt erreicht hat, mit Effizienz und einem Ausmaß an Verallgemeinerung auf unsichtbare Szenarien, das einzigartig ist.“

Der Agent des Teams lernt durch eine Kombination aus Selbsterfahrungen und passiven Beobachtungen, die in Internetdaten enthalten sind. So wie ein Elternteil sein Kind anleiten würde, führten Forscher den Roboter teleoperativ durch Aufgaben, um ihm nützliche Selbsterfahrungen zu ermöglichen.

„Die Effektivität und Effizienz unseres Ansatzes beruht auf unserer neuartigen Richtlinienarchitektur, die es unseren Agenten ermöglicht, auch mit begrenzten Erfahrungen zu argumentieren“, sagte Homanga Bharadwaj, ein Ph.D. Student der Robotik. „RoboAgent reagiert auf bestimmte Text-/visuelle Ziele, indem er Entscheidungen anhand zeitlicher Bewegungsabschnitte vorhersagt und aggregiert, anstatt üblicherweise verwendete Aktionen pro Zeitschritt.“

Roboter lernen in erster Linie aus ihren eigenen Erfahrungen, nicht aus dem, was passiv um sie herum passiert. Diese inhärente Blindheit gegenüber dem, was in ihrer Umgebung geschieht, schränkt sowohl die Vielfalt der Erfahrungen, denen Roboter ausgesetzt sind, als auch ihre Fähigkeit, sich an neue Situationen anzupassen, grundlegend ein. Um diese Einschränkungen zu überwinden, lernt RoboAgent aus Videos im Internet – ähnlich wie Babys durch passives Beobachten Wissen und Verhaltensweisen erwerbenihre Umgebung.

„RoboAgent nutzt die in diesen Videos enthaltenen Informationen, um Vorkenntnisse darüber zu erlangen, wie Menschen mit Objekten interagieren und verschiedene Fähigkeiten nutzen, um Aufgaben erfolgreich zu erledigen“, sagte Mohit Sharma, ein Ph.D. Student der Robotik. „Darüber hinaus ermöglicht die Beobachtung ähnlicher Fähigkeiten in mehreren Szenarien, zu lernen, was für die Erledigung einer Aufgabe erforderlich ist und was nicht. Es nutzt diese Erkenntnisse, wenn es mit unbekannten Aufgaben oder unbekannten Umgebungen konfrontiert wird.“

„Ein Agent, der zu dieser Art des Lernens fähig ist, bringt uns einem allgemeinen Roboter näher, der eine Vielzahl von Aufgaben in verschiedenen, unsichtbaren Umgebungen erledigen kann und sich kontinuierlich weiterentwickelt, während er mehr Erfahrungen sammelt“, sagte Shubham Tulsiani (öffnet ein neues Fenster), ein Assistenzprofessor im Robotik-Institut. „RoboAgent kann einen Roboter mithilfe begrenzter domäneninterner Daten schnell trainieren und sich dabei hauptsächlich auf reichlich verfügbare kostenlose Daten aus dem Internet stützen, um eine Vielzahl von Aufgaben zu erlernen. Dies könnte Roboter in unstrukturierten Umgebungen wie Häusern, Krankenhäusern und anderen öffentlichen Räumen nützlicher machen.“

Die trainierten Modelle, die Codebasis, die Hardwaretreiber und – was am bemerkenswertesten ist – der gesamte im Rahmen dieser Forschung gesammelte Datensatz des Teams sind Open Source. RoboSet ist der größte öffentlich verfügbare Robotik-Datensatz für Standardhardware. Das Team hofft, dass dies anderen ermöglicht, es wiederzuverwenden, anzupassen und weiterzugeben, was im Laufe der Zeit zu einem wirklich grundlegenden allgemeinen Roboteragenten führt.

Zum Forschungsteam gehören Kumar, Tulsiani, Gupta, Bharadwaj, Sharma und Jay Vakil von Meta AI. Weitere Informationen zu RoboAgent und RoboSet finden Sie auf der Website des Projekts. (öffnet sich in neuem Fenster)

Von:Nennen Sie Aaron Aupperlee