Model-Based Quantification of Pathological Voice Production

Language
en
Document Type
Doctoral Thesis
Issue Date
2007-06-15
Issue Year
2007
Authors
Schwarz, Raphael
Editor
Abstract

Hoarseness as primary symptom of voice disorders is based on irregular vocal fold vibrations. The total loss of voice is the most extreme form of a voice disorder. An oncological therapy of laryngeal cancer may result in the loss of voice if localization and state of the carcinoma requires the total excision of the larynx and thus of the vocal folds. Following this, the patient loses the ability to speak. Therefore, the rehabilitation of the vocal function is an important procedure after an oncological therapy. The voice rehabilitation technique makes use of tissue vibrations in the upper part of the esophagus (PE segment) for substitute voice production. The quality of normal and substitute voice depend primarily on the vibration patterns of the voice producing element. By means of endoscopic high-speed recordings the voice generator is observed during voice production. The digital imaging technique enables the computer-aided analysis of the image data. Using appropriate image processing algorithms, the vocal fold dynamics and PE segment vibrations are extracted from the high-speed movies. Within the presented work, methods for the model-based analysis and objective quantification of the extracted vibration patterns are proposed. In principal, the dynamics of a biomechanical model of the voice generator is fitted to the observed vibration patterns by means of automatic parameter optimization. Besides frequency and amplitudes of the oscillation also the specific wave forms are incorporated. The adaptation of the model dynamics is assumed being an optimization problem with an non-convex objective function. The calculated values of the model parameters serve as objective quantification of the voice generator dynamics. Stability and reliability of the proposed optimization algorithms are validated with synthetically generated vibration patterns. First studies mit clinical data prove the applicability of the proposed methods.

Abstract

Heiserkeit, das primäre Symptom einer Stimmstörung, beruht auf irregulären Stimmlippenschwingungen. Der vollständige Verlust der Stimme ist wohl die extremste Form einer Stimmstörung. Die onkologische Therapie von Kehlkopfkrebs kann solch einen Stimmverlust zur Folge haben, wenn Lage und Zustand des Tumors eine vollständige Entfernung des Kehlkopfes und damit der Stimmlippen notwendig macht. Infolge dessen verliert der Patient zunächst die Fähigkeit zu sprechen. Deshalb ist eine Wiederherstellung der Stimmfunktion eine wichtige Maßnahme nach einer Krebsbehandlung. Die Stimmrehabilitation nutzt Schwingungen des Narbengewebes am oberen Ende der Speiseröhre (PE Segment) zur Ersatzstimmgebung. Die Qualität sowohl von Normal- als auch Ersatzstimme hängt maßgeblich von der Anatomie und den Schwingungsmustern der stimmgebenden Elemente ab. Mittels endoskopischer Hochgeschwindigkeitsaufnahmen können die Tongeneratoren während der Stimmgebung in Echtzeit beobachtet werden. Die digitale Aufnahmetechnik ermöglicht eine rechnergestützte Analyse der erzeugten Bilddaten. Die Anwendung geeigneter Bildverarbeitungstechniken dienen der Extraktion der Stimmlippendynamik bzw. der Schwingungsmuster des PE Segments. In der vorliegenden Arbeit werden Methoden zur modellbasierten Analyse und objektiven Quantifizierung der extrahierten Schwingungsmuster entwickelt. Prinzipiell wird die Dynamik eines biomechanischen Modells des Tongenerators an das beobachtete Schwing-ungs-mus-ter unter Verwendung einer automatischen Parameteroptimierung angepasst. Dabei wird neben der Frequenz und Amplitude auch die spezifische Wellenform der Schwingung berücksichtigt. Die Anpassung der Modelldynamik wird als Optimierungsproblem mit nicht-konvexer Zielfunktion betrachtet. Die berechneten Werte der Modellparameter liefern eine objektive Quantifizierung der Dynamik des Tongenerators. Stabilität und Zuverlässigkeit der vorgeschlagenen Optimierungsalgorithmen werden mit synthetisch generierten Schwingungsmustern nachgewiesen. Erste Studien mit klinischen Datensätzen belegen die Anwendbarkeit der entwickelten Methoden.

DOI
Document's Licence
Faculties & Collections
Zugehörige ORCIDs