Detektion und Posenerkennung von Personen mit 3D-Ansichtsmodellen

Weinrich, Christoph

Diplomarbeit Do., 16. Okt.. 2014

Veröffentlicht

Detektion und Posenerkennung von Personen mit 3D-Ansichtsmodellen

Service and assistant robots take over more and more complex duties within our everyday life. Therefore, the communication between humans and robots should be as natural as possible, in order to support an intuitive interaction. Detection and recognition of humans, as well as the estimation of their pose within camera images make a crucial contribution to this challenge. - For this purpose, an appearance based approach which uses a 3D model has been investigated within this diploma thesis. The model evaluates pose hypothesis by interpretation of color and edge features. The modeled upper body pose is determined by 13 parameters for the torso position and turning, the head twist plus the setting of the upper arms and the forearms. - An essential issue of this work is the optimization of the fit value function over the high dimensional pose space, in order to detect the most likely pose hypothesis. To achieve this, it is important that the appearance model causes a preferably smooth fit value function. Furthermore, different methods for optimization of the pose hypotheses within the pose space have been investigated. A tracking approach has been developed, which in contrast to the particle filter, allows the unrestricted motion of pose hypotheses during the optimization process. - Based on the diploma thesis of Dipl.-Ing. Daniel Dornbusch a framework is implemented, which allows the flexible combination of different subcomponents and easy testing of the corresponding parameters. The results of the analysis of the method have been validated by estimating the 3D head-torso pose of a person within a real image sequence.

Assistenz- und Serviceroboter übernehmen zunehmend komplexe Aufgaben im menschlichen Alltag. Damit Personen intuitiv mit solchen Robotern interagieren können, sollte die Kommunikation zwischen Mensch und Roboter möglichst natürlich sein. Die Detektion und Wiedererkennung von Personen, sowie die Erkennung ihrer Pose auf Kamerabildern liefern dazu einen entscheidenden Beitrag. Zu diesem Zweck wird in dieser Diplomarbeit ein ansichtsbasiertes Verfahren vorgestellt, welches auf einem 3D-Modell beruht. Das Modell dient der Bewertung von Posenhypothesen auf der Basis von Farb- und Kantenmerkmalen. Die modellierten Oberkörperposen werden durch 13 Parameter für Torsoposition, und -orientierung, Kopfdrehung, sowie Ober- und Unterarmstellung beschrieben. Ein wesentlicher Kernpunkt der Arbeit ist die Optimierung dieser Posenhypothesen in dem Gütegebirge über dem hochdimensionalen Posenraum, zur Detektion der wahrscheinlichsten Hypothesen. In diesem Zusammenhang ist es von besonderer Bedeutung, dass das Gütegebirge des ansichtsbasierten 3D-Modells eine hohe Glattheit aufweist. Des Weiteren wurden verschiedene Methoden zur Optimierung der Posenhypothesen untersucht. Es wurde ein Tracking-Verfahren entwickelt, welches, im Gegensatz zum Partikel filter, die Bewegung der Hypothesen während der Optimierung uneingeschränkt zulässt. Aufbauend auf der Diplomarbeit von Dipl.-Ing. Daniel Dornbusch wurde ein Framework, zur flexiblen Kombination verschiedener Einzelkomponenten des Verfahrens und der Untersuchung unterschiedlicher Parameterkonfigurationen, implementiert. Die Analyseergebnisse, welche mittels dieses Frameworks erstellt wurden, konnten durch die Schätzung der dreidimensionalen Kopf-Torso-Pose einer Person innerhalb einer realen Bildsequenz validiert werden.

Ilmenau, Techn. Univ., Diplomarbeit, 2009