Mit KI den Überblick behalten
KI-Anwendungen sind in vielen Bereichen des Alltags bereits weit verbreitet. Entsprechend trainierte Netze schreiben Texte, gestalten Bilder und erkennen in mehrdimensionalen Räumen Strukturen, die das menschliche Vorstellungsvermögen oft übersteigen.
Klassische Aufgaben der Auswertung großer (Mengen) Luft- und Satellitenbilddaten sind das Suchen, Finden, Klassifizieren und Zählen von verschiedenen Objekten. Auch hier stößt das menschliche Auge an seine Grenzen. Betrachtet der Auswerter die Gesamtaufnahme, werden kleinere Objekte schnell übersehen. Untersucht er vergrößerte Bildausschnitte, ist es schwierig den Überblick der Gesamtaufnahme zu bewahren. Deshalb werden immer häufiger automatisierte Methoden der digitalen Bildverarbeitung für solche Aufgaben angewendet. Egal ob Schiffe in Häfen, Flugzeuge am Flughafen oder Autos auf Parkplätzen: moderne Objektdetektoren unterstützen mit Hilfe immer stärkerer Hardware-Komponenten in Echtzeit bei der Auswertung fernerkundlicher Daten. Dazu wird das großformatige Bild in Kacheln mit sich überlappenden Bereichen unterteilt und ausgewertet. Dies führte bisher allerdings in den sich überlappenden Bereichen häufig zu doppelten Objektdetektionen.
Aus diesem Grund wurde am Fraunhofer IOSB eine KI entwickelt, die auf dem Ansatz des ARM-NMS beruht (Area Rescoring Mask - Non Maximum Suppression). Zweistufige Objektdetektoren erstellen zunächst Vorschläge für Detektionen und legen sogenannte Bounding Boxes um die Objekte. Anschließend werden die Vorschläge mit der Non Maximum Suppression-Methode aussortiert. Problematisch bei den rechteckigen Bounding Boxen ist, dass deren Form mit den Umrissen der zu detektierenden Objekte meist nicht übereinstimmen. Mit der Area Rescoring Mask-Methode werden deshalb die Formen der Bounding Boxes an die Form des zu detektierenden Objektes angepasst. Außerdem wurde die KI dahingehend trainiert, dass auch Szenen mit stark variierender Objektdichte zuverlässig ausgewertet werden, was bisherige Ansätze vor Probleme stellte.