Die automatisierte Auswertung von Bild- und Videodaten ist ein Kompetenzschwerpunkt am Fraunhofer IOSB und stellt ein wichtiges Element vieler sensorgestützter Anwendungen dar. Oft kommen hierbei Verfahren aus dem Bereich der KI und des maschinellen Lernens zum Einsatz, die es beispielsweise ermöglichen
- Objekte in Bildern und Videos zu erkennen,
- diese Objekte zu verfolgen sowie
- ganze Szenen oder Aktivitäten semantisch zu interpretieren.
Zu unseren Kernkompetenzen in diesem Bereich zählt die Anpassung von komplexen und datenhungrigen Verfahren auf neue Anwendungsfälle. Außerdem greifen wir neueste Forschungsarbeiten etwa zum Einsatz von Foundation-Modellen oder großen Sprach-Bild-Modellen auf und treiben diese voran (vgl. Interview »Vision Language Models heben die Interaktion auf eine neue Stufe«).
Breite Expertise
Unsere Expertise beschränkt sich dabei nicht auf konventionelle Bild- und Videodaten. Sie schließt die Auswertung von Daten anderer bildgebender Sensoren mit ein, etwa Infrarot- und Multispektraldaten sowie die Erstellung und Auswertung von 3D-Punktwolken.
Da die Auswerteverfahren bis in die Anwendung umgesetzt und integriert werden, zählen auch Aspekte wie die Unterstützung diverser Standards und Schnittstellen zu Sensorträgern und die Laufzeitoptimierung komplexer KI-Modelle für Sensorplattformen mit eingeschränktem Energie- oder Platzbudget (bspw. Fahrzeuginnenraum, Drohnen) zu unseren Kompetenzen.
Anwendungsbereiche
Der Einsatzbereich von Bild- und Videoauswerteverfahren ist sehr breit. Wir haben unter anderem in folgenden Anwendungsfeldern Erfahrung:
- Produktion und Qualitätskontrolle,
- Medizin,
- autonomes Fahren bzw. Verkehrsanalyse,
- zivile Sicherheit und
- Verteidigung.