Videobasierte Verfahren zur Schätzung des Interaktionsinteresses bei der Mensch-Roboter-Interaktion mittels Analyse durch Synthese

To realize the operation of mobile service robots in everyday life, it isnecessary to develop intelligent and adaptive dialog systems. Such dialogsystems must be designed in a way that allows an easy and intuitive operationeven for untrained users.For that purpose, it is necessary to detect the mood and intentions of a user.In this thesis, methods for the detection and estimation of the attentionand/or interaction interest of a user of a mobile service robot will bedeveloped and presented. For this purpose, three subsystems are presented: the estimation of theorientation of the upper body, the estimation of the head pose, and theanalysis of the facial expression of a user.Each subsystem is realized by using an Analysis by Synthesis approach.More precisely, Active Shape Models and Active Appearance Modelsare utilized within the three subsystems.Furthermore, different classification and function approximation systems willbe applied to estimate the different features. For that, different methodslike linear regression, Multi Layer Perceptrons, Support Vector Machines,and Self-organizing Maps will be compared.This thesis shows that it is possible to estimate the requested featuresin a sufficient quality and robustness by using the proposed subsystems.Hence it is possible, to estimate the attention and interaction interestby using the upper body orientation, the head pose and the facial expression.Each subsystem was tested with different data sets. Besides own data basesalso foreign data sets were utilized to show the robustness and to measurethe detection rates of the proposed methods.Additionally, this thesis shows, that a selection of the relevant modelparameters leads to better results or at least to equal results, whichcan be achieved by easier classifiers. For this parameter selection theMutal Information is applied in this thesis. Furthermore, an overall system, which integrates the results of the differentsubsystems, is presented in this thesis. The fusion of the results isrealized by using methods from the domain of probabilistic robotics.Based on some easy experiments (performed by briefed subjects) it is shown,that all subsystems can deliver feasible results, which can be integratedin an overall estimation of the attention and/or interaction interest ofa user. Thus, the work presented in this thesis can be used for furthersocioscientific experiments, which are not part of this thesis.

Um den Einsatz von mobilen Servicerobotern im Alltag zu realisieren, istes notwendig, intelligente und adaptive Dialogsysteme zu entwickeln, die es auch einem nicht-eingewiesenen Benutzer erlauben, einen Serviceroboter intuitiv bedienen und nutzen zu können. Dazu ist es erforderlich, die Stimmung und den Gemütszustand des Benutzers zu erfassen, um entsprechend darauf reagieren zu können. Im Rahmen dieser Dissertation werden Methoden entwickelt und vorgestellt, die als Indikatoren zur Schätzung des Interaktionsinteresses (bzw. der Aufmerksamkeit) eines Benutzers auf einem mobilen Serviceroboter unter Realweltbedingungen verwendet werden können.Hierfür werden drei Teilsysteme präsentiert, die die Orientierung des Oberkörpers, die Blickrichtung und die Mimik des Benutzers schätzen können. Alle drei Teilsysteme werden mittels Analysis-by-Synthesis Verfahren realisiert. Dabei kommen Active Shape Models und Active Appearance Modelszum Einsatz. Zur anschließenden Klassifikation bzw. Schätzung der gesuchten Merkmale werden u.a. Verfahren der linearen Regression, Multi Layer Perceptrons, Support Vector Machines und Self-organizing Maps miteinander verglichen. Es wird gezeigt, dass es mit den drei Teilsystemen möglich ist, die gesuchten Informationen zu bestimmen und damit Indizien für Interesse und Aufmerksamkeit gewonnen werden können. Die Tests wurden dabei jeweils mit bekanntem und unbekanntem Datenmaterial durchgeführt. Zusätzlich wird gezeigt, dass eine Vorauswahl relevanter Parameter auf Basis der Mutual Information zu besseren Ergebnissen führt bzw. gleich gute Ergebnisse mittels einfacherer Klassifikatoren erreicht werden können. Weiterhin wird ein Gesamtsystem vorgestellt, in dem alle drei Teilsysteme miteinander kombiniert werden. Zur Schätzung von Interesse und Aufmerksamkeit kommen dabei Methoden aus der probabilistischen Robotik zum Einsatz. Anhand durchgeführter Experimente mit eingewiesenen Probanden wird gezeigt, dass die Ergebnisse der drei Teilmodule plausibel sind und die Resultate zur Schätzung von Interesse und Aufmerksamkeit verwendet werden können. Das prototypische Gesamtsystem kann daher als Grundlage und Basis fürzukünftige sozialwissenschaftliche Untersuchungen zur Bestimmung des Interaktionsinteresses genutzt werden, die nicht Bestandteil dieser Dissertation sind.

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.