Informationsextraktion aus technischen Zeichnungen mit gängigen Deep-Learning-Architekturen

24.03.2021

Dieses Projekt wurde in Zusammenarbeit mit der EDI GmbH (Engineering Data Intelligence) durchgeführt. Die EDI GmbH bietet KI-basierte Lösungen an, die zur Optimierung, Steuerung sowie Überwachung von Prozessen und Maschinen eingesetzt werden können. In diesem Projekt ging es darum, wie technische Zeichnungen nachdigitalisiert werden können, um daraufhin automatisch Informationen aus den Zeichnungen zu extrahieren. Hierfür stellte EDI dem SDSC-BW rund 1.000 technische Zeichnungen im PDF-Format zur Verfügung.

Technische Zeichnungen sind der Standard für die Darstellung des Aufbaus und der Funktion von Bauteilen. Beschriftete Informationen, wie z.B. Toleranzen, bilden eine wichtige Grundlage für die Planung der individuellen Fertigungsschritte und die Ermittlung von Bearbeitungszeiten wie auch Fertigungskosten. Geringe Toleranzen erfordern präzisere Fertigungsprozesse oder gezielte Nachbearbeitungsschritte und kostenintensive Wartung. Wie in Abb. 1 dargestellt, gibt es innerhalb einer technischen Zeichnung unterschiedliche Toleranzen. Toleranzen beziehen sich nicht nur auf globale Abmessungen, sondern beinhalten subsummiert eine Vielzahl an spezifischen Details. Heutzutage ist es üblich, dass solche Angaben handschriftlich durchgeführt werden, da viele Produktionsprozesse nicht vollständig automatisiert sind. Bei Aufträgen, die Tausende unterschiedliche Teile enthalten können, ist die manuelle Auswertung aller Zeichnungen zeitaufwändig und schlichtweg nicht rentabel. Zur Lösung des Problems benötigt es eine nachträgliche Digitalisierung der technischen Zeichnung, sowie einer automatischen Erkennung und Verarbeitung aller vorhandenen Merkmale. Ein Resultat dessen wäre eine drastische Reduzierung der Erstellungszeit kommerzieller Angebote.

Leider erreichen derzeit verfügbare Lösungen zur optischen Zeichenerkennung (OCR) oftmals nicht die erforderliche Präzision, im Rahmen von technischen Zeichnungen kommerziell nutzbar zu sein. Ein Grund dafür ist, dass OCR-Algorithmen empfindlich auf die Rotation von Zeichen reagieren. Ein weiterer Grund ist, dass OCR-Algorithmen keine Informationen über die Struktur zwischen den Zeichen liefern.

Ein Hersteller von Maschinenteilen verwendet bereits ein Erkennungssystem und auf Basis dessen wurde von den Spezialisten des SDSC-BW der Entwurf einer Prozesspipeline vorgeschlagen. Unter zuhilfenahme moderner Deep-Learning-Ansätze der Objekterkennung sollen Textinformationen der Zeichnungen extrahiert werden, anstelle der aktuell genutzten OCR-Pipeline.

Abb. 1 zeigt Ergebnisse zur Erkennung verschiedener Durchmesserspezifikationen in unterschiedlichen Ausrichtungen. Die vom SDSC-BW vorgeschlagene Pipeline ist in drei Schritten aufgebaut. Im ersten Schritt wurde die morphologische Verarbeitung – Analyse von Strukturen in Bildern, sowie die Binarisierungsmethode angewandt, um die technischen Zeichnungen für den zweiten Schritt vorzubereiten. Daraufhin wurde ein Erkennungsmodell namens YoloV3, einem state-of-the-art Echtzeit-Objekterkennungssystem, in Kombination mit einem sogenannten Erkennungskopf, der die Orientierung der Bounding Box um die Handschrifft herum bereitstellen kann, angewandt. Die extrahierte Orientierung auf Basis der Bounding-Box hilft bei der anschließenden Erkennung der jeweiligen Zeichen.

Das Erkennungsmodell zeigt eine Genauigkeit auf einem realen Industriedatensatz von 96,2 % (mit einer durchschnittlichen Präzision von 93,1 %), was bedeutet, dass das Modell die von Hand geschriebene Toleranz genau lokalisieren und von den umgebenden Informationen trennen kann. Im dritten Schritt wird die Architektur des neuronalen Netzes mit einer Ziffernerkennungsfunktion erweitert, um die Informationen in jeder ermittelten Bounding Box zu identifizieren.

Die Ergebnisse des Potenzialanalyseprojekts zeigen, dass Bildverarbeitungsmethoden auf Basis tiefer neuronaler Netze erheblich besser mit unterschiedlichen Schriftarten umgehen können und gerade das für die Nachdigitalisierung von technischen Zeichnungen von großem Vorteil ist und für den kommerziellen Einsatz in Betracht gezogen werden könnte.

Beitrag von Yexu Zhou