Zum Inhalt springen

Multimodale Embeddings für semantische Suche in Luftbildern im Maßstab

Auf den Punkt: Multimodale KI-Embeddings mit Amazon Nova ermöglichen semantische Natursprach-Suche über Luftbildarchive ohne spezielles Pro-Aufgabe-Training.

AWS und der Luftbildanbieter Vexcel haben ein System entwickelt, das Milliarden von Luftbildpixeln mittels multimodaler KI-Embeddings durchsuchbar macht – ohne Training spezieller Modelle für jede neue Aufgabe. Mit Amazon Nova Multimodal Embeddings können Nutzer Luftbilder per Natursprache abfragen, um etwa Pools, Straßennetze oder Solarpanels zu lokalisieren.

Das traditionelle Vorgehen bei der Analyse von Luftbildarchiven erfordert entweder manuelle Inspektion einzelner Kartenkacheln oder das Training eines eigenen Computer-Vision-Modells für jede neue Fragestellung. Vexcel, das einen der weltweit größten Luftbilderfassungsprogramme betreibt und hochauflösende Daten in über 45 Ländern sammelt, führte mit dem AWS Generative AI Innovation Center Experimente durch: multimodale Embeddings, LLM-gestützte Bildbeschriftung und Vektorsuche über Amazon Bedrock und Amazon OpenSearch Serverless.

Die Evaluation basierte auf OpenStreetMap-Daten als Trainingsgrundwahrheit. Vier zentrale Experimente verglichen unterschiedliche Embedding-Modelle, Fusionsstrategien (wie mehrere Sichtwinkel pro Ort kombiniert werden), Bildtext-Integration und Suchmethoden. Amazon Nova Multimodal Embeddings erzielte dabei die höchsten F1-Scores in der Auswertung. Der Ansatz eliminiert die Notwendigkeit, für jede neue Anfrage ein spezialisiertes Modell zu trainieren – stattdessen indexiert man die Bildbibliothek einmalig und beantwortet verschiedenste Fragen über Natursprache-Abfragen innerhalb von Sekunden.

Die zentrale technische Herausforderung bei Luftbildsuche unterscheidet sich grundlegend von der Bildsuche in Consumer-Foto-Sammlungen: Luftbilder zeigen einen Ort nicht aus einer einzelnen Perspektive, sondern liegen als Multi-View-Datensätze vor – verschiedene Blickwinkel desselben Ortes. Die Fusion dieser Perspektiven, die Entscheidung über Bildtexte (ob sie tatsächlich Suchqualität verbessern oder nur Kosten erhöhen) und die Wahl des Embedding-Modells prägen die Suchgenauigkeit maßgeblich.

Vexcel hat die Ergebnisse in ein Produktangebot namens Vexcel Intelligence überführt, das sich derzeit in Preview-Phase befindet. Das System erschließt die Luftbildbibliothek als durchsuchbare, KI-abfragbare Ressource und adressiert Anwendungsfälle in Versicherung, Immobilien, Verwaltung, Infrastruktur und Landwirtschaft.


Quelle: aws.amazon.com · Erschienen 22. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.1.

Share on: