Robust Time-Invariant Broadband Beamforming as a Convex Optimization Problem

Language
en
Document Type
Doctoral Thesis
Issue Date
2015-04-21
Issue Year
2015
Authors
Mabande, Edwin Tererai
Editor
Abstract

Beamformer designs that provide high directional gain with a small array aperture and a small number of sensors are highly desirable for applications such as hands-free communication and telecommunication, and acoustic front-ends for human-machine interfaces. However, their application in practice is greatly limited due to the high sensitivity of these designs to sensor self-noise, mismatch between sensor characteristics, and imprecise sensor positioning, which are typically unavoidable in practice. It is therefore necessary to control the robustness of these beamformer designs. The white noise gain (WNG) is a well-known and widely used robustness measure for beamformers. However, its application in controlling the robustness of broadband beamformer designs has been somewhat limited due to the difficulty of incorporating it directly into the design as a constraint. Beamformer designs that control the robustness by constraining the WNG directly are highly desirable.

This thesis provides a generic framework for the design of robust time-invariant broadband beamformers as a constrained optimization problem, where robustness is achieved by constraining the WNG directly. In the constrained problem we seek to minimize a beamformer cost function that is convex subject to constraints on WNG and on the response in the desired look direction.

Six special cases of the generic framework were derived. The constrained problems are shown to be convex and therefore well-known methods for convex optimization can be used to solve these problems resulting in globally optimal solutions for the chosen design parameters. Simulations confirmed the ability of these designs to constrain the WNG effectively, thus ensuring robust beamformer designs. Thus the generic framework allows for flexible robustness control via constraining the WNG directly.

Furthermore, this thesis provides a method for three-dimensional room geometry inference based on robust and high-resolution beamforming techniques that are special cases of the generic framework. Uncontrolled broadband acoustic sources such as speech are used to infer the room geometry. The high accuracy of the proposed room geometry inference technique is confirmed by experimental evaluations based on both simulated and measured data for moderately reverberant rooms.

Abstract

Keulenformer-Entwurfsmethoden, (engl. Beamformer designs) die eine hohe richtungsabhängige Verstärkung (engl. directivity) mit einer kleinen Sensorgruppen-Apertur (engl. sensor-array aperture) und einer geringen Anzahl an Sensoren bieten, sind sehr wünschenswert, insbesondere für Freisprechanwendungen und andere Mensch-Maschine-Schnittstellen mit akustischer Vorverarbeitung. Der praktische Nutzen solcher Methoden ist jedoch auf Grund der hohen Empfindlichkeit gegenüber dem Eigenrauschen der Sensoren, einem fehlendem Abgleich ihrer Übertragungseigenschaften und einer zu ungenauen Platzierung der Sensoren stark beschränkt. Daher ist es notwendig, die Robustheit dieser Entwurfsmethoden zu steuern. Der Gewinn für inkohärentes Rauschen (engl. White Noise Gain (WNG)) ist ein etabliertes und weit verbreitetes Maß zur Bestimmung der Robustheit von Keulenformern. Allerdings war die Verwendung dieses Maßes zur Steuerung der Robustheit breitbandiger Keulenformer-Entwürfe bislang beschränkt, da sich eine direkte Einbeziehung dieses Maßes in den Entwurfsprozess schwierig gestaltet. Entwurfsmethoden für Keulenformer, die die Robustheit durch Begrenzung des WNG direkt steuern sind hochgradig wünschenswert.

Die vorliegende Arbeit stellt einen allgemeingültigen Ansatz vor, in dem sich der Entwurf robuster zeitinvarianter Breitband-Keulenformer als Optimierungsaufgabe mit Nebenbedingung darstellt, wobei die gewünschte Robustheit durch eine gezielte Begrenzung des WNG erreicht wird. In dieser Optimierung mit Nebenbedingung ist eine Kostenfunktion des Keulenformers zu minimieren, die konvex hinsichtlich der Einschränkungen des WNG sowie der Übertragungsfunktion für die gewünschte Blickrichtung ist.

Sechs Spezialfälle des vorgestellten Rahmenwerks wurden in der vorliegenden Arbeit abgeleitet. Es wird gezeigt, dass die Probleme mit Nebenbedingung konvexer Natur sind und deswegen bekannte Methoden der konvexen Optimierung verwendet werden können, sodass das globale Optimum für die gewählten Entwurfparameter erreicht wird. Simulationen belegen die Eigenschaft der vorgeschlagenen Herangehensweise, den WNG effektiv zu begrenzen und so robuste Keulenformer-Entwürfe zu gewährleisten. Daher erlaubt dieser allgemeine Ansatz eine flexible Einstellung der Robustheit durch die direkte Begrenzung des WNG.

Darüber hinaus beschreibt diese Arbeit eine Methode zur Gewinnung von Information über die Geometrie dreidimensionaler Räume durch hochauflösende Keulenformer-Techniken, die sich als Spezialfälle des allgemeinen Ansatzes ergeben. Unbekannte und breitbandige akustische Quellen wie Sprache werden zur Ableitung der Raumgeometrie eingesetzt. Die hohe Genauigkeit des Verfahrens zur Bestimmung der Raumgeometrie wird durch experimentelle Auswertungen gezeigt, die sowohl auf simulierten als auch auf real gemessenen Daten mit moderatem Nachhall basieren.

DOI
Faculties & Collections
Zugehörige ORCIDs