Forschungsbericht G 201819 02/2022 -PDF-Datei-
Autonomous object detection and scene interpretation in aerial images ANTONIA
- Herausgeber/Verlag: DVGW
- Format: 54 Seiten
- Ausgabe: 2022
- Verkaufseinheit: 1
- Mindestabnahme: 1
- Artikel-Nr.: 511988
Für die vorliegende Aufgabe wurde ein Objektdetektor auf Basis des RetinaNet, einem schlanken, leistungsfähigen und schnellen neuronalen Netz, entwickelt. Zur Entwicklung und Evaluierung des Detektors und anderer Aspekte wurde für das Projekt ein Datensatz mit dem Namen ArtifiVe-Potsdam entworfen, der hochaufgelöste Luftbilder der Stadt Potsdam enthält und inhaltlich gut zu den Daten in ANNeBEL passt. Der Detektor erzielt auf diesem Datensatz sehr gute Leistungen, allerdings zeigt die Simulation von sehr kleinen Datensätzen gleichzeitig, dass ein Datenmangel zu einer schlechten Detektionsleistung und insbesondere zu niedrigen Genauigkeiten führt. Die Messdaten zeigen dabei einen charakteristischen Verlauf und ermöglichen die Abschätzung des Datenbedarfs in anderen Anwendungen. Zur Bewältigung dieser Leistungsdefizite wurden zwei Ansätze verfolgt. Der Erste war die Generierung synthetischer Bilddaten auf Basis von einfachen zweidimensionalen Konstruktionszeichnungen von Fahrzeugen und simplen künstlichen Hintergründen. Das Training des Detektors mit sehr kleinen realen Datensätzen und diesen synthetischen Bilddaten führte zu deutlichen Leistungssteigerungen. Die Verwendung von realen Hintergrundbildern in Kombination mit den synthetischen Fahrzeugen steigerte die Genauigkeit des Detektors noch einmal deutlich. Als zweiter Ansatz wurde das sogenannte Vortraining oder Pretraining, ein vorgelagerter Trainingsprozess, evaluiert. Dafür wurde eine Methode weiterentwickelt, die klassische Bildverarbeitungsmethoden verwendet, um in nicht-annotierten Bildern mögliche Objekte zu identifizieren. Trainiert man einen Detektor mit diesen sehr unspezifischen Objektinformationen, erlangt er relativ gute Fähigkeiten zur Detektion und kann bereits vergleichsweise gut Fahrzeuge detektieren. Setzt man das Training anschließend mit wenigen, aber annotierten realen Bilddaten fort, zeigt sich abermals eine deutliche Leistungssteigerung.
Der beschriebene Objektdetektor stellt eine gute Ausgangsbasis für die in ANNeBEL vorliegenden Fragestellung dar, kann einfach übertragen werden und ist eine gute Ausgangsbasis für zukünftige Erweiterungen. Die beobachteten Messwerte geben einen guten Eindruck, welches Leistungsniveau der Detektor mit ausreichend großen Datensätzen in ANNeBEL erzielen kann. Da dies für manche relevante Objektklasse in ANNeBEL nur schwer zu erreichen ist, können die beiden beschriebenen Ansätze die Auswirkungen abschwächen. Beide bieten unterschiedliche Vorteile und erlauben so zum einen die spezifische Erweiterung um neue Objekte oder Hintergründe und die Verwendung von sehr großen, nicht-annotierten Datensätzen. Eine kombinierte Verwendung erscheint daher sinnvoll. Insgesamt beweist sich der Einsatz neuronaler Netze als vielversprechend und eröffnet neue Möglichkeiten, die mit klassischen Verfahren nur schwer zu erzielen oder gar nicht gegeben wären.
1 Einleitung
1.1 Projektgenese
1.2 Projektfokus und Aufgaben
1.3 Aufgaben von ANTONIA
2 Daten
2.1 ISRPS Potsdam-Datensatz
2.2 ArtifiVe-Potsdam
3 Neuronale Netze und Objektdetektion
3.1 Neuronale Netze
3.2 Bildauswertung
3.3 Objektdetektion
3.1 RetinaNet und Modifikationen
3.1 Training
3.2 Metriken
3.3 Evaluation
3.3.1 Spitzenleistung
3.3.2 Einfluss der Trainingsiterationen
3.3.3 Einfluss der Bodenauflösung
3.3.4 Einfluss der Szenengröße
3.3.5 Einfluss der Trainingsdatensatzgröße
4 Künstliche Daten
4.1 Datengeneration
4.2 Evaluierung
5 Pretraining
5.1 Klassifikation als Pretraining
5.2 DETReg und Selective Search
5.3 Evaluierung
5.3.1 Klassifikation als Pretraining
5.3.2 Selective-Search als Pretraining
6 Zusammenfassung und Ausblick
6.1 Zusammenfassung
6.2 Verbleibende Herausforderungen und Empfehlungen
7 Literaturverzeichnis
8 Abbildungsverzeichnis
9 Tabellenverzeichnis
10 Index