Echtzeitscanner für die Roboter-Interaktion

3D-Echtzeitsensor für die Roboterinteraktion.
© Fraunhofer IOF
3D-Echtzeitsensor für die Roboterinteraktion.

Während die allgemeine Entwicklung von Mensch-Maschine-Schnittstellen rasant voranschreitet (Sprachsteuerung, Touch-Bedienung), gibt es unerfüllte Anforderungen in Anwendungsfeldern, die auf die genaue Echtzeit-3D-Erfassung von Menschen im Raum angewiesen sind.

Um diesen Anforderungen Rechnung zu tragen, wurde ein echtzeitfähiges 3D-Messsystem geschaffen, welches mit niedriger Latenzzeit und hoher Framerate 3D-Daten von komplexen dynamischen Szenen im Bereich der Mensch-Maschine-Interaktion zur Verfügung stellt. Wegen des Einsatzes im Aufenthaltsbereich von Menschen war Irritationsfreiheit eine wichtige Anforderung.

Zur Demonstration des 3D-Messsystems wurde ein Exponat aufgebaut, in dem ein Industrieroboter auf menschliche Eingaben an einer Interaktionsfläche (Eindrücken einer Gummimembran) reagiert. Das Messsystem erstellt kontinuierlich 3D-Scans der Membran. Die 3D-Daten werden live auf zwei Monitoren angezeigt. Die nachgeschaltete Datenauswertung bestimmt die jeweils tiefste Eindruckstelle auf der Membran und ermittelt so kontinuierlich neue Zielpositionen für den Roboter.

 

Versuchaufbau – Die Aufgabe des Benutzers besteht darin, alle Bälle mit dem Roboterarm anzustoßen. Die Bewegungsbefehle werden über das 3D-Touchpad eingegeben.
© Fraunhofer IOF
Versuchaufbau – Die Aufgabe des Benutzers besteht darin, alle Bälle mit dem Roboterarm anzustoßen. Die Bewegungsbefehle werden über das 3D-Touchpad eingegeben.

Das 3D-Messsystem verwendet eine Stereo-Kamera mit aktivem High-Speed-Projektor mit aperiodischen Sinusmustern. Der Projektor arbeitet mit nicht-sichtbarem Infrarotlicht (850 nm Wellenlänge) und ist deshalb irritationsfrei (= blendfrei). Das System stellt im Echtzeitbetrieb eine 3D-Datenrate von 36 3D-Datensätzen pro Sekunde mit einer Latenz von 80 ms bereit. Jeder 3D-Datensatz besteht aus einer Million 3D-Punkten.

Die Kameras des Scanners werden synchron betrieben und nehmen jeweils 360 Bilder pro Sekunde auf. Die 3D-Rekonstruktionsrechnung erfolgt auf einem Standard-PC vollständig auf der Grafikhardware (GPU-Programm mit OpenCL), so dass für anschließende Auswertungen der 3D-Daten die volle CPU-Leistung zur Verfügung steht. Dies ermöglicht vielfältige Anwendungen mit unterschiedlichsten Datenverarbeitungsanforderungen, wie z. B. kontinuierliche Formüberwachung in Fließband-Systemen, Pick-and-Place-Anwendungen, Gesichtserkennung in Sicherheitsschleusen oder 3D-Gestik-Erkennung.

Autoren

Patrick Dietrich

Kevin Srokos

Ingo Gebhart

Peter Kühmstedt

Gunther Notni