UA24 — Новини України

Eine bahnbrechende Entwicklung in der Welt der Technologie ermöglicht es Robotern, nicht nur schriftliche Befehle zu verstehen, sondern diese auch sofort in der realen Umgebung auszuführen.

In der Welt der Technologie ereignet sich ein bedeutendes Ereignis: Ein neues System für künstliche Intelligenz (KI) ermöglicht es Robotern, nicht nur schriftliche Befehle von Menschen zu verstehen, sondern diese auch umgehend in der realen Umgebung auszuführen. Diese Entwicklung, die Sprachmodelle mit Software zur Steuerung von Robotern kombiniert, eröffnet die Möglichkeit, mündliche und schriftliche Anweisungen in konkrete Handlungen umzuwandeln, was die Ansätze zur Automatisierung erheblich verändern könnte.

Darüber berichtet das Magazin Interesting Engineering, das Fortschritte in den Bereichen Robotik und künstliche Intelligenz beleuchtet. Forscher des Huawei Noah’s Ark Lab, der Technischen Universität Darmstadt und der ETH Zürich haben ihre Kräfte gebündelt, um ein System zu entwickeln, das große Sprachmodelle mit dem Robot Operating System (ROS) integriert. Dies ermöglicht es Robotern, nicht nur Anweisungen zu empfangen, sondern diese auch in einer physischen Umgebung auszuführen, was einen wichtigen Schritt in der Entwicklung autonomer Technologien darstellt.

Das im Rahmen dieses Projekts entwickelte System verarbeitet Textbefehle und zerlegt diese in aufeinanderfolgende Schritte. Zum Beispiel wird der Befehl, einen grünen Block anzuheben und ihn auf ein schwarzes Regal zu legen, in eine Reihe von Aktionen umgewandelt, die der Roboter über ROS ausführt. Dieser Prozess ist entscheidend, da er die Interaktion zwischen Mensch und Maschine erheblich vereinfacht.

Die Forscher betonen, dass die Schaffung autonomer Roboter, die in der Lage sind, natürliche Sprache in zuverlässige physische Handlungen umzuwandeln, eine bedeutende Herausforderung für die künstliche Intelligenz bleibt. Sie haben demonstriert, dass die Kombination eines Sprachmodells mit ROS ein universelles System für „verkörperte“ Intelligenz schafft, und die vollständige Implementierung dieses Systems wurde öffentlich zugänglich gemacht, was es anderen Forschern ermöglicht, diese Technologie zu nutzen und weiterzuentwickeln.

Die im Rahmen dieses Projekts entwickelte Plattform vereint die Fähigkeit von Sprachmodellen zur Analyse mit einem beliebten Robotermanagementsystem. Dies ermöglicht die Interpretation von Anweisungen, ohne dass für jede Aufgabe eine separate Programmierung erforderlich ist, was den Lernprozess für Roboter erheblich vereinfacht.

Die Autoren des Projekts erklären, dass der Agent automatisch die Ergebnisse des Sprachmodells in Roboteraktionen umwandelt, verschiedene Ausführungsmodi unterstützt, neue grundlegende Fähigkeiten durch Nachahmung erlernen kann und diese durch Feedback von Menschen oder der Umgebung verbessert. Dies eröffnet neue Horizonte für den Einsatz von Robotern in verschiedenen Bereichen, von der Industrie bis hin zum Haushalt.

Das System verfügt über zwei Möglichkeiten zur Aufgabenerfüllung. Im ersten Fall erstellt das Modell kleine Codefragmente zur Steuerung des Roboters. Im zweiten Fall baut es Entscheidungsstrukturen auf, die als Verhaltensbäume bekannt sind und helfen, sich anzupassen, wenn ein Schritt nicht funktioniert hat. Dies erhöht die Flexibilität des Systems und ermöglicht die Bearbeitung sowohl einfacher als auch komplexer Aufgaben, was einen wichtigen Aspekt in der Robotik darstellt.

Während Tests an verschiedenen Robotern konnte das System zuverlässig Befehle interpretieren und Aktionen in unterschiedlichen Szenarien ausführen. Laut den Autoren zeigten die Experimente Robustheit, Skalierbarkeit und Universalität des Ansatzes, insbesondere für langfristige Aufgaben, das Umstellen von Objekten auf einem Tisch, die Optimierung von Aktionen und die Fernsteuerung. Dies deutet darauf hin, dass die neue Technologie in verschiedenen Bereichen weitreichende Anwendung finden könnte.

Alle Ergebnisse wurden unter Verwendung von vortrainierten Sprachmodellen mit offenem Quellcode erzielt. Roboter können auch auf der Grundlage von Feedback lernen und ihre Leistung schrittweise verbessern, ohne dass eine komplexe Neuprogrammierung erforderlich ist. Dies ist ein weiteres wichtiges Ergebnis, das den Integrationsprozess von Robotern in den Alltag erheblich vereinfachen könnte.

Die Forscher sind der Ansicht, dass die Kombination von Sprachverständnis mit physischen Handlungen die Nutzung von Robotern in dynamischen Umgebungen beschleunigen kann, in denen Anpassungsfähigkeit wichtig ist. In Zukunft planen sie, das System für komplexere Aufgaben und verschiedene Robotertypen zu skalieren, was neue Möglichkeiten für die Entwicklung von Robotik und künstlicher Intelligenz verspricht.

Roboter lernen, Befehle mit neuem KI-System auszuführen