Lade Veranstaltungen

Maschinen lernen sehen

3D-Computer-Vision im Zeit­alter der tiefen neuro­nalen Netze

Vortrag von Prof. Dr. Daniel Cremers

Das menschliche Sehvermögen ist eine so intuitive Leistung unseres Gehirns, dass wir oft vergessen, welch gewaltige Rechenaufgabe dahintersteht: Aus zwei flächigen Projektionen auf der Netzhaut konstruiert unser Geist ein stabiles, dreidimensionales Abbild der Welt. Für die Künstliche Intelligenz galt die Nachahmung dieser Fähigkeit – die Computer Vision – lange Zeit als eine der schwierigsten Hürden.

In seinem Vortrag beleuchtet Prof. Daniel Cremers den radikalen Paradigmenwechsel, den dieses Forschungsfeld in den letzten Jahren vollzogen hat. Während klassische Ansätze der 3D-Rekonstruktion primär auf handgefertigten mathematischen Modellen und geometrischen Prinzipien basierten, haben tiefe neuronale Netze (Deep Learning) die Spielregeln grundlegend verändert. Heute lernen Maschinen nicht nur, Objekte in Bildern zu erkennen, sondern sie können aus Kameradaten in Echtzeit hochpräzise 3D-Karten ihrer Umgebung erstellen und ihre eigene Position darin bestimmen (SLAM – Simultaneous Localization and Mapping).

Der Vortrag zeigt auf, wie moderne Algorithmen die Brücke zwischen klassischer Geometrie und datengetriebener Intelligenz schlagen. Anhand von Anwendungsbeispielen aus der autonomen Mobilität und der Robotik wird demonstriert, was Maschinen heute bereits »sehen« können.

Prof. Cremers führt aus, dass das »Sehen« der Maschine eine Form von räumlicher Intelligenz darstellt, die für die Interaktion mit der physischen Welt unerlässlich ist. Damit berührt der Vortrag die Kernfrage des Symposiums: Ist das, was wir im Computer erschaffen, nur ein »Zaubertrick« der Mathematik, oder entwickelt sich hier tatsächlich eine neue Form von funktionalem Geist?

Nach oben