Ein neues Verfahren der Johannes Kepler Universität Linz ermöglicht die dreidimensionale Wahrnehmung von Drohnenaufnahmen in Echtzeit – selbst bei starker Verdeckung und weiter Entfernung. Ergebnisse der Studie werden nun im renommierten Fachjournal Nature Scientific Reports veröffentlicht.
„Die Studie zeigt, dass der Mensch beim Lösen schwieriger Probleme nicht immer ganz durch den Computer ersetzt werden kann – auch nicht im Zeitalter der Künstlichen Intelligenz. Die Synergien beider bieten oft Möglichkeiten, die von einer Seite alleine aus nicht erreicht werden können“, so JKU-Forschungsleiter Univ.-Prof. Oliver Bimber.
Lesen Sie auch
Die visuelle Tiefenwahrnehmung des Menschen, also die Möglichkeit, Objekte in unterschiedlichen Entfernungen wahrzunehmen, basiert im Wesentlichen auf der Tatsache, dass unsere Augen perspektivisch leicht unterschiedliche Bilder sehen.
Dieser stereoskopische Effekt wird auch in 3D-Kinos genutzt, um Filme plastisch wirken zu lassen. Aber nicht nur Human Vision nutzt diesen Effekt, sondern auch Computer Vision. Das heißt, der Computer verarbeitet stereoskopische oder auch multiskopische (mehr als zwei) Bildaufnahmen aus unterschiedlichen Perspektiven, um daraus Tiefeninformationen der aufgenommenen Szene zu errechnen.
Für Mensch und Computer klappt die stereoskopische Tiefenwahrnehmung allerdings nicht, wenn die beobachtete Szene teilweise verdeckt ist. Findet unser Gehirn oder der Computer in beiden Bildern nicht mehr genügend Übereinstimmungen, sind beide nicht in der Lage, die Tiefe abzuschätzen.
Human Vision und Computer Vision ergänzen sich
Eine gemeinsame Studie zwischen dem Institut für Computer Grafik der JKU und der Cambridge University hat nun untersucht, ob und unter welchen Bedingungen stereoskopische Tiefenwahrnehmungen von stark verdeckten Szenen möglich sind. Das Ergebnis überrascht: Mit heutigen, rein computerbasierten Ansätzen gar nicht – durch die Synergie zwischen Computer Vision und menschlicher visueller Wahrnehmung allerdings ist es durchaus möglich.
Die Forscher untersuchten dabei stereoskopische Wärmebildaufnahmen, die Drohnen über dicht bewaldetem Gebiet aufgenommen haben. Ziel war es, verdeckte Personen, die sich im Wald befinden, zu finden und deren Größe abzuschätzen. Es stellte sich heraus, dass state-of-the-art 3D Computer-Rekonstruktionsverfahren hier zu 100% versagten. Menschliche Proband*innen, die im Rahmen einer groß angelegten Benutzer*innenstudie diese Bilddaten mittels 3D-Brillen betrachteten, hatten zunächst auch nicht mehr Erfolg.
Dann kam die Neuerung an die Reihe: Verrechnet man vorab die Bilddaten mit einem an der JKU entwickelten Bildgebungsverfahren – Airborne Optical Sectioning (AOS) – um Verdeckungen, die durch die Vegetation entstehen, visuell zu reduzieren, dann wurde die Detektion und Tiefenabschätzung für Menschen sehr gut möglich, während die rein computergestützten Verfahren immer noch keine Ergebnisse liefern konnten.