Lernbeiträge im Rahmen einer kognitiven Architektur für die intelligente  Prozessführung

Schaffernicht, Erik

Veröffentlicht

Lernbeiträge im Rahmen einer kognitiven Architektur für die intelligente Prozessführung

In this thesis, important aspects of a cognitive architecture for learning control tasks are discussed. Highlighted are the topics of feature extraction, reinforcement learning and learning management in the context of the perception-action-cycle. The contributions in the field of feature extraction utilize informationtheoretic measures such as mutual information to formulate new hybrid feature extraction algorithms. Finding features that are explicitly linked with the errors made by a learning system are the focus. It is shown this approach based on residuals is superior to classical methods. Another topic of interest is the estimation of mutual information in the context of feature extraction. State of the art reinforcement learning methods are investigated for their suitability for challenging applications. This work addresses issues of learning management, such as the exploration-exploitation dilemma, the plasticity-stability dilemma and the reward decomposition problem. New contributions are made in the form of the diffusion tree-based reinforcement learning algorithm and the SMILE approach. Likewise, an architectural extension is proposed to organize the learning process. It uses a process map as the core piece to achieve this organization. Experimental evidence that the proposed system can learn the solution to real problems is presented in the challenging scenario of intelligent combustion control. The system is used to learn a control strategy in a coal-fired power plant. The achieved results surpass existing systems and human experts.

In dieser Arbeit werden wichtige Aspekte einer kognitiven Architektur für das Erlernen von Regelungsaufgaben beleuchtet. Dabei geht es primär um die Merkmalsextraktion, das Reinforcement Learning und das Lernmanagement im Rahmen des Wahrnehmungs-Handlungs-Zyklus. Für die Merkmalsextraktion werden dabei mit Hilfe informationstheoretischer Größen, wie der Transinformation, neue hybride Merkmalsextraktionsverfahren vorgestellt. Neuartig ist dabei der Ansatz, Merkmale zu suchen, die explizit mit den gemachten Fehlern eines lernenden Systems verknüpft sind. Es wird gezeigt, dass diese residuumsbasierten Ansätze klassischen Methoden überlegen sind. Es wird ebenfalls untersucht, welche Schätzverfahren für die Bestimmung der Transinformation im Sinne der Merkmalsextraktion geeignet sind. Als Entscheidungsinstanz der Gesamtarchitektur werden aktuelle Reinforcement Learning Verfahren auf ihre Eignung für komplexe Anwendungen hin untersucht. Dabei wird auch auf Probleme des Lernmanagements, wie das Explorations-Exploitations-Dilemma, das Stabilitäts-Plastizitäts-Dilemma und das Rewarddekompositionsproblem eingegangen. Neue Beiträge werden dabei in Form des Diffusionsbaumbasiertes Reinforcement Learning und des SMILE-Algorithmus geliefert. Ebenso wird eine Architekturerweiterung zum Organisieren der Lernprozesse vorgeschlagen, welche im Kern um eine Prozesskarte angeordnet ist. Der experimentelle Nachweis, dass das vorgestellte System die Lösung für reale Probleme erlernen kann, wird am herausfordernden Szenarioder intelligenten Feuerungsführung erbracht. Dabei wird das Gesamtsystem zur Regelung eines mit Steinkohle gefeuerten Kraftwerks eingesetzt, wobei Ergebnisse erzielt werden, die bisher existierende Systeme und auch menschliche Experten übertreffen.

Vorschau

Einordnung

Verlag, Verleger(in):

Universitätsverlag Ilmenau <Ilmenau>

Akademische Betreuung:

Groß, Horst-Michael

Gutachter(in), Rezensent(in):

Riedmiller, Martin; Villmann, Thomas

Datum der Erstellung:

28.09.2012

Datum der Annahme der Promotion / des Abschlusses:

13.06.2012

Datum der Veröffentlichung:

28.09.2012

URN:

urn:nbn:de:gbv:ilm1-2012000276

PPN:

732582288

ISBN:

978-3-86360-043-3

Sprache:

Deutsch

Ressourcentyp:

Text

Umfang:

XIII, 296 Seiten

Erscheinungsort:

Ilmenau

Verlag:

Universitätsverlag Ilmenau

Schlagwörter:

Maschinelles Lernen; Kraftwerk; Merkmalsauswahl; Reinforcement Learning; Lernmanagement; Kognitive Architektur; Transinformation

Klassifikation:

Klasse A

DDC-Sachgruppe der DNB:

004 Informatik

Klassifikation:

für Harvesting bereitgestellt

Klassifikation:

DNB Meldung

Klassifikation:

Thüringer Pflichtexemplare

Einrichtung:

Technische Universität Ilmenau, Fakultät für Informatik und Automatisierung

auf die Merkliste

Zitieren

Zitierform:

Zitier-Link kopieren

Rechte

Export

BibTeX, Endnote, MODS, MARCXML, RIS, ISI, PICA, DC, CSV