Hierarchical feed-forward models for robust object recognition

Bax I (2007)
Bielefeld (Germany): Bielefeld University.

Bielefelder E-Dissertation | Englisch
 
Download
OA
Autor*in
Bax, Ingo
Gutachter*in / Betreuer*in
Abstract / Bemerkung
Die vorliegende Arbeit beschäftigt sich mit einem speziellen Typ Neuronales Netz, welches sich durch eine hierarchische, vorwärtsgerichtete Topologie auszeichnet. Das Netz imitiert durch eine alternierende Anwendung von Transformationspaaren, bestehend aus Redundanz- und Invarianz-Erzeugung, ein grundlegendes Prinzip der Informationsverarbeitung in biologischen Sehsystemen und lässt sich so zur Lösung praktischer Objekterkennungsaufgaben nutzen. Die Arbeit behandelt neben einer allgemeinen formalen Beschreibung des neuronalen Modells zunächst die Optimierung von Modellparametern mittels eines speziell entwickelten Verfahrens zur Messung der Komplexität von Multiklassen-Datensätzen. Anschließend wird das Modell auf zwei praktische Computer-Vision-Problemstellungen angewendet: die Klassifikation von natürlichen Bildausschnitten und die segmentierungsfreie Multiklassen-Detektion in Vollbildern. Die experimentellen Ergebnisse beruhen auf teilsynthetischen Bilddatensätzen, die durch das Hinzufügen von künstlichen Störungen auf bekannte Datenbanken natürlicher Bilder erzeugt werden. Dabei werden die drei verschiedenen Bilddomänen abgedeckt: handgeschriebene Ziffern, kompakte Objekte und Gesichter. Mit Hilfe dieser Datensätze wird gezeigt, dass der Ansatz ermöglicht, bei der Erkennung A-priori-Wissen über die generellen statistischen Eigenschaften von natürlichen Bildern gewinnbringend auszunutzen. In natürlichen Bildern typischerweise auftretende Störungen können durch die Verarbeitung des Netzes sukzessive ausgeglichen werden, wodurch deutlich bessere Erkennungsleistungen erzielt werden können, als es mit herkömmlichen Methoden wie etwa Eigenraum-basierten Verfahren oder Nächste-Nachbarn-Klassifikatoren möglich ist.

This thesis deals with a special type of neural network which features a hierarchical feed-forward topology. By alternatingly applying pairs of transformations that consist of redundancy and invariance creation, the network imitates a fundamental principle of information processing found in biological vision systems and can therefore be used for solving practical object recognition tasks. The thesis first presents a general formal description of the neural model and then deals with the optimization of model parameters using a special method for measuring the complexity of multi-class datasets. Then, the model is applied to two practical computer vision problems: classification of natural image patches and segmentation-free multi-class object detection in full-frame images. Experimental results rely on semi-synthetic image datasets, which are generated by applying artificial distortions to well-known natural image databases covering the three domains of handwritten digits, compact objects, and faces. Using these datasets it is shown that the approach allows us to exploit a priori knowledge about the general statistical properties of natural imagery. Distortions typically occurring in natural images can be successively compensated, leading to a significant increase in recognition performance compared to common approaches such as eigenspace-based methods or nearest neighbor classification.
Stichworte
Hierarchische vorwärtsgerichtete Modelle; Neocognitron; Detektion; Hierarchical feed-forward models; Computer vision; Maschinelles Sehen; Neuronales Netz; Objekterkennung; Mustererkennung
Jahr
2007
Page URI
https://pub.uni-bielefeld.de/record/2304779

Zitieren

Bax I. Hierarchical feed-forward models for robust object recognition. Bielefeld (Germany): Bielefeld University; 2007.
Bax, I. (2007). Hierarchical feed-forward models for robust object recognition. Bielefeld (Germany): Bielefeld University.
Bax, Ingo. 2007. Hierarchical feed-forward models for robust object recognition. Bielefeld (Germany): Bielefeld University.
Bax, I. (2007). Hierarchical feed-forward models for robust object recognition. Bielefeld (Germany): Bielefeld University.
Bax, I., 2007. Hierarchical feed-forward models for robust object recognition, Bielefeld (Germany): Bielefeld University.
I. Bax, Hierarchical feed-forward models for robust object recognition, Bielefeld (Germany): Bielefeld University, 2007.
Bax, I.: Hierarchical feed-forward models for robust object recognition. Bielefeld University, Bielefeld (Germany) (2007).
Bax, Ingo. Hierarchical feed-forward models for robust object recognition. Bielefeld (Germany): Bielefeld University, 2007.
Alle Dateien verfügbar unter der/den folgenden Lizenz(en):
Copyright Statement:
Dieses Objekt ist durch das Urheberrecht und/oder verwandte Schutzrechte geschützt. [...]
Volltext(e)
Access Level
OA Open Access
Zuletzt Hochgeladen
2019-09-06T08:57:47Z
MD5 Prüfsumme
560b29b8e331f527b16205713af2d43f


Export

Markieren/ Markierung löschen
Markierte Publikationen

Open Data PUB

Suchen in

Google Scholar