Auf den Punkt: Gemini Robotics-ER 1.6 verbessert räumliches Verständnis und ermöglicht Robotern erstmals die Ablesung komplexer Instrumente durch spezialisiertes Embodied-Reasoning-Training.
Google hat Gemini Robotics-ER 1.6 veröffentlicht, ein Sprachmodell das speziell für Robotik-Aufgaben entwickelt wurde und Fähigkeiten wie räumliches Verständnis, Instrumentenablesung und Erfolgsdetection verbessert. Das Modell soll Robotern ermöglichen, physische Umgebungen präziser wahrzunehmen und autonom komplexe Aufgaben auszuführen.
Gemini Robotics-ER 1.6 ist die neueste Version eines Modells, das speziell für die Anforderungen autonomer Robotersysteme ausgelegt wurde. Im Gegensatz zu allgemeinen Sprachmodellen konzentriert sich dieses Modell auf „embodied reasoning” — die Fähigkeit, digitale Intelligenz mit physischen Aktionen in der realen Welt zu verbinden. Das Modell adressiert zentrale Robotik-Probleme wie visuelle Wahrnehmung, räumliches Verständnis, Aufgabenplanung und die Erkennung von Erfolg oder Misserfolg einer Aktion.
Die Version 1.6 bringt mehrere konkrete Verbesserungen gegenüber dem Vorgänger Robotics-ER 1.5 und dem allgemeinen Modell Gemini 3.0 Flash. Ein neues Merkmal ist die Fähigkeit zur Instrumentenablesung — das Modell kann nun komplexe Druckanzeigen und Sichtfenster interpretieren. Diese Funktion entstand aus der Zusammenarbeit mit Boston Dynamics und adressiert einen praktischen Bedarf in industriellen Roboter-Einsätzen. Das Modell fungiert als hochrangiger Reasoning-Motor und kann externe Tools aufrufen, etwa Google Search, Vision-Language-Action-Modelle (VLAs) oder nutzerdefinierte Funktionen, um Aufgaben auszuführen.
Praktiker können Gemini Robotics-ER 1.6 ab sofort über die Gemini API und Google AI Studio nutzen. Google stellt zusätzlich ein Developer-Colab-Notebook bereit, das Beispiele für die Konfiguration des Modells und die Formulierung von Prompts für Embodied-Reasoning-Aufgaben enthält. Die Benchmarks zeigen Leistungsgewinne bei räumlichem und physikalischem Verständnis, insbesondere bei Aufgaben wie Zeigen (Pointing), Zählen und Erfolgsdetection.
Quelle: ainews-dev.lumi-systems.io · Erschienen 17. Mai 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.5.2.