Mit dem Kartendienst Here haben unter anderem die Autobauer BMW, Daimler und Audi sich in der Welt der digitalen Stadtpläne positioniert. Here bietet HD-Karten, die für punktgenaue Navigation auch im autonomen Fahren notwendig sind. Allerdings können selbst diese Karten nicht alles abbilden. Es gibt, glaubt man dem Start-up Terraloupe aus München, auch bei den High-Definition-Karten noch deutlich Luft nach oben. Die Erfassung der Landkarten am Boden hat die Nachteile, dass sich perspektivische Verzerrungen nicht vermeiden lassen, Entfernungen teils nicht exakt wiedergegeben werden können oder die Belichtung einen Strich durch die Rechnung macht.

Umgebung pixelgenau abbilden

Satellitenbilder wie beispielsweise von Google Maps bieten nicht in allen Landstrichen die nötige Schärfe, um den Kartendiensten wirksam auf die Sprünge zu helfen. Letztlich sei aber jeder einzelne Pixel wichtig. Hier springt Terraloupe in die Bresche. Entstanden ist die Technologie eigentlich aus der Fragestellung heraus, wie sich nach Naturkatastrophen wie beispielsweise Hurricanes möglichst schnell der entstandene Schaden feststellen lassen kann. Luftbilder an sich geben einen guten Überblick. Die Auswertung durch Menschen dauert aber schlicht zu lange. Die intelligente Software des Start-ups erledigt diese Aufgabe ungleich schneller. Dazu nutzt Terraloupe Luftbilder aus möglichst geringer Höhe, die das System dann auswertet und HD-Karten um fehlende Informationen ergänzt.

Computer erkennt Gesten

In einem anderen Gebiet macht sich twentybn (twenty billion neurons, 20 Milliarden Neuronen) aus Berlin verdient. Ein Computer denkt - und sieht vor allem - wie ein Computer und nicht wie ein Mensch. Twentybn hat in einem großangelegten Crowdsourcing-Projekt eben jene Datenbasis geschaffen, mit der die AI aber genau das lernen soll. Menschen auf der ganzen Welt haben Videos von einfachen Handlungen aufgenommen. So kann der Computer zum Beispiel erkennen, dass "etwas" aus einem anderen "Etwas" in einen dritten Gegenstand geschüttet wird. Gleichsam "sieht" die AI, dass das schüttende Etwas nun leer ist, sofern der Mensch das leere Glas in die Kamera hält. Zudem erkennt das Computerhirn auch wischende Gesten oder, dass sich etwas oder jemand entfernt. Es geht also nicht nur darum, anhand von Mustern zu erkennen, welcher Gegenstand vor der Kamera steht. Vielmehr soll die AI erkennen, was ein Gegenstand tut. Und dazu reicht neben der AI eine ganz normale 2D-Kamera.

Tausende Videos als Datenbasis

Natürlich erfordert diese Datenbasis einen enormen Aufwand. Schließlich sind von jeder einzelnen Aktion zahlreiche Videos notwendig, damit die Software diese auch sicher wiedererkennt. Hier behilft sich twentybn des Crowdsourcings. Menschen auf der ganzen Welt nehmen Videos von den Gesten auf und übermitteln sie an das Start-up. Aktuell hat twentybn mehr als 250.000 Videos im Bestand, davon knapp 150.000 zu Handgesten und beinahe 110.000 zu einfachen Interaktionen mit Alltagsobjekten, zum Beispiel 888 Sequenzen, auf denen zu sehen ist, wie etwas geöffnet wird, oder 5.410 Videos die zeigen, wie zwei Finger nach unten wischen.

AI überwacht per Kamera

Diesen neu gewonnenen Erfahrungsschatz kann die AI nutzen und weiter daraus lernen. Denkbar sind Bediengesten für die Systeme an Bord, eine sich drehende Hand, um den Radiosender einzustellen oder ein Wisch nach hinten, um das Schiebedach zu öffnen. Außerdem kann die AI auch ein Auge auf den Zustand der Passagiere haben. So könnte die Technik im Auto beispielsweise erkennen wenn der Fahrer einschläft, oder ein medizinischer Notfall besteht und entsprechende Schritte einleiten. Ersteres dürfte spätestens beim vollautonomen Fahren auf Level fünf dafür sorgen, dass der Computer sanfte Schlafmusik einspielt oder rechtzeitig vor Ankunft den virtuellen Wecker klingeln lässt.