Forschungsbericht G 201819 02/2022 -PDF-Datei-

Autonomous object detection and scene interpretation in aerial images ANTONIA

246,10 €*
  • DVGW
  • 54 Seiten
  • 2022
  • 1
  • 1
  • 511988
ST
Der Forschungsbericht G 201819 fasst die Forschungs- und Entwicklungsarbeit des DVGW Projekts ANTONIA zusammen, das die technologischen Grundlagen für das DVGW Projekt ANNeBEL geschaffen hat und in dem darüber hinaus eine Reihe wissenschaftlicher Untersuchungen durchgeführt und publiziert wurden. Das Projekt ANNeBEL bearbeitet die automatisierte Überwachung von Erdgastransportleitungen. Dabei sollen mögliche Gefahren, vorrangig Baufahrzeuge, die sich um Umfeld der Leitungen aufhalten, mit digitalen Luftbildkameras und automatisierter Bildanalyse detektiert werden. ANTONIAs Fokus liegt dabei auf der Entwicklung eines geeigneten Objektdetektionsverfahrens auf Basis neuronaler Netze. Da diese Netze die gewünschten Fähigkeiten anhand von Daten „erlernen“, werden dafür große Mengen an Daten benötigt, die um Beschreibungen der gesuchten Inhalte, den sogenannten Annotationen, ergänzt werden müssen. Da die Sammlung und Annotation solcher Daten arbeits- und zeitintensiv sind, soll ANTONIA weiterhin Strategien zur Reduktion des Datenbedarfs entwickeln.

Für die vorliegende Aufgabe wurde ein Objektdetektor auf Basis des RetinaNet, einem schlanken, leistungsfähigen und schnellen neuronalen Netz, entwickelt. Zur Entwicklung und Evaluierung des Detektors und anderer Aspekte wurde für das Projekt ein Datensatz mit dem Namen ArtifiVe-Potsdam entworfen, der hochaufgelöste Luftbilder der Stadt Potsdam enthält und inhaltlich gut zu den Daten in ANNeBEL passt. Der Detektor erzielt auf diesem Datensatz sehr gute Leistungen, allerdings zeigt die Simulation von sehr kleinen Datensätzen gleichzeitig, dass ein Datenmangel zu einer schlechten Detektionsleistung und insbesondere zu niedrigen Genauigkeiten führt. Die Messdaten zeigen dabei einen charakteristischen Verlauf und ermöglichen die Abschätzung des Datenbedarfs in anderen Anwendungen. Zur Bewältigung dieser Leistungsdefizite wurden zwei Ansätze verfolgt. Der Erste war die Generierung synthetischer Bilddaten auf Basis von einfachen zweidimensionalen Konstruktionszeichnungen von Fahrzeugen und simplen künstlichen Hintergründen. Das Training des Detektors mit sehr kleinen realen Datensätzen und diesen synthetischen Bilddaten führte zu deutlichen Leistungssteigerungen. Die Verwendung von realen Hintergrundbildern in Kombination mit den synthetischen Fahrzeugen steigerte die Genauigkeit des Detektors noch einmal deutlich. Als zweiter Ansatz wurde das sogenannte Vortraining oder Pretraining, ein vorgelagerter Trainingsprozess, evaluiert. Dafür wurde eine Methode weiterentwickelt, die klassische Bildverarbeitungsmethoden verwendet, um in nicht-annotierten Bildern mögliche Objekte zu identifizieren. Trainiert man einen Detektor mit diesen sehr unspezifischen Objektinformationen, erlangt er relativ gute Fähigkeiten zur Detektion und kann bereits vergleichsweise gut Fahrzeuge detektieren. Setzt man das Training anschließend mit wenigen, aber annotierten realen Bilddaten fort, zeigt sich abermals eine deutliche Leistungssteigerung.

Der beschriebene Objektdetektor stellt eine gute Ausgangsbasis für die in ANNeBEL vorliegenden Fragestellung dar, kann einfach übertragen werden und ist eine gute Ausgangsbasis für zukünftige Erweiterungen. Die beobachteten Messwerte geben einen guten Eindruck, welches Leistungsniveau der Detektor mit ausreichend großen Datensätzen in ANNeBEL erzielen kann. Da dies für manche relevante Objektklasse in ANNeBEL nur schwer zu erreichen ist, können die beiden beschriebenen Ansätze die Auswirkungen abschwächen. Beide bieten unterschiedliche Vorteile und erlauben so zum einen die spezifische Erweiterung um neue Objekte oder Hintergründe und die Verwendung von sehr großen, nicht-annotierten Datensätzen. Eine kombinierte Verwendung erscheint daher sinnvoll. Insgesamt beweist sich der Einsatz neuronaler Netze als vielversprechend und eröffnet neue Möglichkeiten, die mit klassischen Verfahren nur schwer zu erzielen oder gar nicht gegeben wären.

1 Einleitung

1.1 Projektgenese

1.2 Projektfokus und Aufgaben

1.3 Aufgaben von ANTONIA

2 Daten

2.1 ISRPS Potsdam-Datensatz

2.2 ArtifiVe-Potsdam

3 Neuronale Netze und Objektdetektion

3.1 Neuronale Netze

3.2 Bildauswertung

3.3 Objektdetektion

3.1 RetinaNet und Modifikationen

3.1 Training

3.2 Metriken

3.3 Evaluation

3.3.1 Spitzenleistung

3.3.2 Einfluss der Trainingsiterationen

3.3.3 Einfluss der Bodenauflösung

3.3.4 Einfluss der Szenengröße

3.3.5 Einfluss der Trainingsdatensatzgröße

4 Künstliche Daten

4.1 Datengeneration

4.2 Evaluierung

5 Pretraining

5.1 Klassifikation als Pretraining

5.2 DETReg und Selective Search

5.3 Evaluierung

5.3.1 Klassifikation als Pretraining

5.3.2 Selective-Search als Pretraining

6 Zusammenfassung und Ausblick

6.1 Zusammenfassung

6.2 Verbleibende Herausforderungen und Empfehlungen

7 Literaturverzeichnis

8 Abbildungsverzeichnis

9 Tabellenverzeichnis

10 Index