Forschungsangebote der Professur für Informationsmanagement
Forschungsergebnis: Automatisierte Erzeugung robuster synthetischer Bilddatensätze und KI-Modelle für Computer-Vision-Anwendungen
Das computerbasierte Sehen (Computer Vision, CV) bietet vielfältige ungeahnte, ungenutzte Potenziale im Produktionsbereich. Insbesondere im Bereich der Qualitätskontrolle helfen Bilderkennungssysteme, um Fehler im Produktionsbereich schneller und zuverlässiger zu erkennen und damit Ausschuss zu vermeiden bzw. zu verringern. Die manuelle Gewinnung der hierfür benötigten Bilddatensätze und das Training der KI-Modelle sind zeitaufwendig und folglich sehr kostenintensiv. Um die Kosten zu senken und die Einführungen von Computer-Vision-Lösungen zu beschleunigen, hat die HTWD Konzepte für die automatisierte Generierung von synthetischen Trainingsbilddaten entwickelt. Mit diesen lassen sich beliebige Objekte in unterschiedlichsten Umgebungen als fotorealistische Bilder ausgeben. Sie erlauben, automatisiert in kurzer Zeit synthetische und gelabelte Bilddatensätze von kundenspezifischen Produkten und Prozessabläufen zu erzeugen, mit welchen neuronale Netze für robuste Objekterkennungsmodelle trainiert werden. Diese Modelle sind z.B. geeignet, um aussagekräftige Informationen aus Bildern zu gewinnen und auf Basis dessen unterschiedliche Optimierungsmaßnahmen im Bereich der Tätigkeiten zur Qualitätskontrolle, Instandhaltung, Wartung und Montage etc. zu gewährleisten und damit die Mitarbeitenden zu entlasten.
Hintergrund: Zahlreiche Aufgaben der Computer Vision hängen in hohem Maße von der Objekterkennung ab, z.B. die Segmentierung von Objekten, die Bildbeschriftung und Objektverfolgung. Convolutional Neural Networks (CNNs) spielen heutzutage eine Schlüsselrolle bei der Erkennung von Objekten. Dabei hängt die Leistung von CNNs weitgehend von der Qualität und Quantität von Trainingsdatensätzen ab, die in realen Anwendungen oft schwer herzustellen sind. Um die Robustheit solcher Modelle zu gewährleisten, ist es wichtig, dass die Trainingsinstanzen unter verschiedenen zufälligen Bedingungen entstehen. Diese Bedingungen sind in der Regel eine Kombination aus verschiedenen Faktoren, einschließlich der Lichtverhältnisse, Objektstandort, das Vorhandensein mehrerer Objekte in der Szene, verschiedene Hintergründe und der Winkel der Kamera. Im Besonderen benötigen Unternehmen, je nach Anwendungsbereich (z.B. Fehlererkennung, Erkennung von Anomalien, Zustandsüberwachung, prädiktive Qualität und so weiter), spezielle Modelle für ihre kundenspezifischen Produkte. Daher haben sie immer Schwierigkeiten, eine große Anzahl von randomisierten konditionierten Instanzen ihrer Objekte bereitzustellen. Der Hauptgrund dafür ist, dass der Prozess der Erfassung von randomisierten und konditionierten Bildern von realen Objekten in der Regel kostspielig, zeitaufwendig und in der Praxis schwierig ist. Aufgrund der Effizienz synthetischer Daten für das Training solcher Systeme, haben Methoden zur Generierung synthetischer Trainingsdaten in letzter Zeit viel Aufmerksamkeit auf sich gezogen.
Ein Angebot der
Details
Zielkunden: Industrie, IKT, Logistik
Zielgruppe: Konzern, KMU, Forschungsinstitute, Technologiezentrum
Geschäftsmodell: Digitization
Technologie Beschreibung:
- Bilderkennung & -analyse
- Künstliche Intelligenz & Maschinelles Lernen
- Computer-Vision-Anwendungen, Objekterkennungsmodelle
Alleinstellungsmerkmal: Beschleunigung Digitaler Geschäftsmodelle
Kosten: Die Kosten werden auf Basis der Anforderungen im Rahmen des Industrieauftrages kalkuliert.
Technologischer Reifegrad: TRL 5 - Technologie in relevanter Umgebung überprüft (Prototyp vorhanden)
Implementierungszeit: Hoch (innerhalb eines Monats)