Auf den Punkt: Google entwickelt einen KI-gestützten Mauszeiger, der verstehen soll, was der Nutzer intuitiv möchte. Mit vier Interaktionsprinzipien sollen komplexe Befehle durch einfaches Zeigen und Sprechen ersetzt werden – die KI erfasst automatisch den Kontext.
Der Mauszeiger ist seit über 50 Jahren ein treuer Begleiter auf Computerbildschirmen. Google entwickelt nun KI-gestützte Funktionen, die den Zeiger nicht nur erkennen lassen, worauf er zeigt, sondern auch verstehen, warum dies für den Nutzer wichtig ist.
Der traditionelle Mauszeiger hat sich kaum verändert, obwohl die Technologie enorme Fortschritte gemacht hat. Google möchte diesen fundamentalen Bestandteil von Computerinteraktionen neu überdenken. Das Ziel: KI-Tools sollten nicht in separaten Fenster existieren, sondern sich nahtlos in die alltäglichen Arbeitsabläufe der Nutzer integrieren.
Die neue Vision basiert auf vier Kernprinzipien, die die Kommunikation zwischen Mensch und Computer vereinfachen. Anstelle langer Text-Prompts ermöglichen intuitivere Interaktionen eine seelenloses Zusammenspiel von Benutzerabsicht und Systemverständnis. So könnte ein Nutzer beispielsweise auf ein Gebäude zeigen und sagen: “Zeige mir Directions.” Die KI erfasst den Kontext bereits und benötigt keine weiteren Eingaben.
Google hat experimentelle Demos eines Gemini-gestützten KI-Zeigers entwickelt. Im Google AI Studio können Nutzer nun durch einfaches Zeigen und Sprechen Bilder bearbeiten oder Orte auf einer Karte suchen. Das System demonstriert, wie künstliche Intelligenz die Last der Kontexterklärung vom Menschen auf die Maschine verlagert.