Zweistufige kontextsensitive Sprecherklassifikation am Beispiel von Alter und Geschlecht

Müller, Christian

Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-25884

Titel:	Zweistufige kontextsensitive Sprecherklassifikation am Beispiel von Alter und Geschlecht
VerfasserIn:	Müller, Christian
Sprache:	Deutsch
Erscheinungsjahr:	2005
Kontrollierte Schlagwörter:	Automatische Sprechererkennung Dialogsystem Lebensalter Geschlecht
Freie Schlagwörter:	kontextsensitive Sprecherklassifikation speaker classification dialog system age gender
DDC-Sachgruppe:	004 Informatik
Dokumenttyp:	Dissertation
Abstract:	In der vorliegenden Dissertation wird ein zweistufiger Ansatz zur Sprecherklassifikation am Beispiel Alter und Geschlecht vorgestellt. Dazu werden zunächst die Ergebnisse umfangreicher Korpusanalysen präsentiert, die als Referenzbasis humanwissenschaftlicher Studien geeignet sind. Es wird gezeigt, dass die Modelle, die mithilfe dieser Daten trainiert wurden, in der Lage sind, die genannten Sprechereigenschaften mit einer Genauigkeit zu erkennen, die teilweise das Fünffache des jeweiligen Zufallsniveaus beträgt. Darüber hinaus zeichnet sich der vorgestellte Ansatz vor allen Dingen durch die so genannte Zweite Ebene aus, auf der mithilfe von Dynamischen Bayesschen Netzen eine Fusion multipler Klassifikationsergebnisse unter Berücksichtigung des auditiven Kontextes erfolgt. In der Arbeit wird außerdem ein konkretes Sprecherklassifikationssystem beschrieben, welches für das Anwendungsszenario von mobilen, sprachbasierten Dialogsystemen entwickelt worden ist. This dissertation describes a two-layered speaker classification approach on the example of age and gender. First of all, the results of comprehensive corpus analyses are presented that are suitable to serve as a reference basis for further studies in human sciences. It is showed, that the models which are trained using these data are able to recognize the above mentioned characteristics with an accuracy that is up to five times better than the respective chance level. In addition, the presented approach distinguishes itself by the so called Second Layer, on which a context sensitive fusion of multiple classification results is accomplished using Dynamic Bayesian Networks. The dissertation also describes a concrete speaker classification system which was developed for the application scenario of mobile spoken dialog systems.
Link zu diesem Datensatz:	urn:nbn:de:bsz:291-scidok-12685 hdl:20.500.11880/25940 http://dx.doi.org/10.22028/D291-25884
Erstgutachter:	Wahlster, Wolfgang
Tag der mündlichen Prüfung:	13-Jan-2006
Datum des Eintrags:	30-Aug-2007
Fakultät:	MI - Fakultät für Mathematik und Informatik
Fachrichtung:	MI - Informatik
Sammlung:	SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:

Datei	Beschreibung	Größe	Format
Dissertation_3540_Muell_Chri_2005.pdf		7,94 MB	Adobe PDF	Öffnen/Anzeigen

Export: BibTex Statistik anzeigen

Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.