Lernen in Parallelen Universen

Lade...
Vorschaubild
Dateien
Diss_Wiswedel.pdf
Diss_Wiswedel.pdfGröße: 6.66 MBDownloads: 588
Datum
2008
Autor:innen
Herausgeber:innen
Kontakt
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
DOI (zitierfähiger Link)
ArXiv-ID
Internationale Patentnummer
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Open Access Green
Core Facility der Universität Konstanz
Gesperrt bis
Titel in einer weiteren Sprache
Learning in Parallel Universes
Forschungsvorhaben
Organisationseinheiten
Zeitschriftenheft
Publikationstyp
Dissertation
Publikationsstatus
Published
Erschienen in
Zusammenfassung

Klassische Data Mining Verfahren beruhen praktisch immer auf einer eindeutigen Objektdarstellung, häufig in Form eines hochdimensionalen Attributvektors pro Objekt. In vielen Anwendungsbereichen zeigt sich jedoch, dass die zu analysierenden Objekte (Moleküle, 3D Modelle, Prozesse) auf vielfältige Weise beschrieben werden können, was zu einer Vielzahl von Darstellungsräumen, so genannten Parallelen Universen, führt.<br />


Im Rahmen dieser Arbeit wird das Lernen in Parallelen Universen als neues Lernkonzept vorgestellt, das die simultane Analyse der verschiedenen Universen umfasst. Ziel ist die Erzeugung eines verständlichen Modells, das interessante Strukturen in den Daten, verteilt auf verschiedene Universen darstellt. Das gefundene Modell besteht also aus Teilmodellen, die in jeweils unterschiedlichen Universen gültig sind und zusammen die den gesamten Objekten zugrunde liegende Struktur beschreiben. Dazu werden zwei Verfahren, die dieses neue Lernkonzept umsetzen, neu entwickelt und untersucht. Das erste Verfahren dient zur Lösung überwachter Lernprobleme. Es beruht auf der Erstellung lokaler Nachbarschaftsdiagramme, kurz Neighborgramme, für die Objekte einer oder mehrerer Zielklassen in allen Universen. Beruhend auf Kennwerten wie z. B. der Klassenverteilung oder -dichte in diesen Diagrammen werden so Neighborgramme aus unterschiedlichen Universen ausgewählt, um ein Klassifikationsmodell zu erstellen. Von praktischem Interesse ist dabei auch die Neighborgram-Visualisierung, die zum einen den Vergleich der Nachbarschaftsbeziehung in den Universen ermöglicht und zum anderen eine interaktive Modellerstellung erlaubt. Das zweite Verfahren beschreibt eine Erweiterung verschiedener unüberwachter unscharfer Clusterverfahren. Die Kernidee dabei ist die Modellierung der Zugehörigkeit zu Parallelen Universen durch neue Variablen in den klassischen Zielfunktionen, wobei die Optimierung dann auch in Bezug auf diese neuen Variablen stattfinden. Die Ausgabe der vorgestellten Verfahren beinhaltet u. a. die Clusterprototypen sowie Zugehörigkeitswerte der Cluster (bzw. oder der Objekte) zu Universen, so dass für jeden Cluster oder für jedes Objekt eine partielle Zuordnung zu den individuellen Universen vorgenommen werden kann.<br />


Die beschriebenen Verfahren werden auf verschiedenen Datensätzen evaluiert. Diese<br />


umfassen einen molekularen Datensatz, bei dem basierend auf vier Universen die Aktivität von Molekülen vorherzusagen ist, sowie einen Datensatz von 3D Objekten, die in<br />


16 Universen beschrieben sind.

Zusammenfassung in einer weiteren Sprache

Classical data mining techniques are almost always based on a unique object representation, which is often realized as a high-dimensional attribute vector per object. In many application domains, however, the objects to be analyzed (molecules, 3D models, processes) can be described easily in various ways, which leads to a variety of object representations: so called Parallel Universes. <br />


This thesis introduces Learning in Parallel Universes as a novel learning concept, which encompasses the simultaneous analysis of the various universes. The learning objective is the generation of an interpretable model, comprising interesting patterns in the data, potentially distributed among the available universes. The model consists of partial models, whereby each model respectively applies to a subset of the universes. When combined they altogether explain the nature of the underlying objects. Two novel techniques, which implement this new learning concept, are introduced and examined. The first technique solves supervised learning problems. It is based on<br />


the construction of local neighborhood diagrams, called Neighborgrams, for objects belonging to one or more target classes in all universes. Depending on characteristic values such as class distribution or the class density of such diagrams, neighborgrams from different universes are selected to build a classification model. Furthermore, the neighborgram visualization is of high practical interest as it allows for a visual comparison of neighborhood relationships and at the same time enables an interactive model construction.<br />


The second technique comprises an extension of different unsupervised fuzzy clustering methods. The basic idea is the extension of the classical objective function by membership values that encode memberships to Parallel Universes, whereby optimization is also carried out with respect to the newly introduced membership values. The output of these methods includes, for example, cluster prototypes as well as membership values for clusters (or objects) to universes, which allow a partial assignment of clusters or objects to individual universes.<br />


The methods are demonstrated and evaluated on different data sets, among others on a molecular data set described in four universes and a 3D model data set in 16 universes.

Fachgebiet (DDC)
004 Informatik
Schlagwörter
Lernen, Parallele Universe, Data Mining, Beschreibungsräume, Learning Parallel Universes, Data Mining, Descriptor Spaces
Konferenz
Rezension
undefined / . - undefined, undefined
Zitieren
ISO 690WISWEDEL, Bernd, 2008. Lernen in Parallelen Universen [Dissertation]. Konstanz: University of Konstanz
BibTex
@phdthesis{Wiswedel2008Lerne-5755,
  year={2008},
  title={Lernen in Parallelen Universen},
  author={Wiswedel, Bernd},
  address={Konstanz},
  school={Universität Konstanz}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/5755">
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T15:59:50Z</dcterms:available>
    <dc:contributor>Wiswedel, Bernd</dc:contributor>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/5755/1/Diss_Wiswedel.pdf"/>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/5755/1/Diss_Wiswedel.pdf"/>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dcterms:abstract xml:lang="deu">Klassische Data Mining Verfahren beruhen praktisch immer auf einer eindeutigen Objektdarstellung, häufig in Form eines hochdimensionalen Attributvektors pro Objekt. In vielen Anwendungsbereichen zeigt sich jedoch, dass die zu analysierenden Objekte (Moleküle, 3D Modelle, Prozesse) auf vielfältige Weise beschrieben werden können, was zu einer Vielzahl von Darstellungsräumen, so genannten Parallelen Universen, führt.&amp;lt;br /&amp;gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Im Rahmen dieser Arbeit wird das Lernen in Parallelen Universen als neues Lernkonzept vorgestellt, das die simultane Analyse der verschiedenen Universen umfasst. Ziel ist die Erzeugung eines verständlichen Modells, das interessante Strukturen in den Daten, verteilt auf verschiedene Universen darstellt. Das gefundene Modell besteht also aus Teilmodellen, die in jeweils unterschiedlichen Universen gültig sind und zusammen die den gesamten Objekten zugrunde liegende Struktur beschreiben. Dazu werden zwei Verfahren, die dieses neue Lernkonzept umsetzen, neu entwickelt und untersucht. Das erste Verfahren dient zur Lösung überwachter Lernprobleme. Es beruht auf der Erstellung lokaler Nachbarschaftsdiagramme, kurz Neighborgramme, für die Objekte einer oder mehrerer Zielklassen in allen Universen. Beruhend auf Kennwerten wie z. B. der Klassenverteilung oder -dichte in diesen Diagrammen werden so Neighborgramme aus unterschiedlichen Universen ausgewählt, um ein Klassifikationsmodell zu erstellen. Von praktischem Interesse ist dabei auch die Neighborgram-Visualisierung, die zum einen den Vergleich der Nachbarschaftsbeziehung in den Universen ermöglicht und zum anderen eine interaktive Modellerstellung erlaubt. Das zweite Verfahren beschreibt eine Erweiterung verschiedener unüberwachter unscharfer Clusterverfahren. Die Kernidee dabei ist die Modellierung der Zugehörigkeit zu Parallelen Universen durch neue Variablen in den klassischen Zielfunktionen, wobei die Optimierung dann auch in Bezug auf diese neuen Variablen stattfinden. Die Ausgabe der vorgestellten Verfahren beinhaltet u. a. die Clusterprototypen sowie Zugehörigkeitswerte der Cluster (bzw. oder der Objekte) zu Universen, so dass für jeden Cluster oder für jedes Objekt eine partielle Zuordnung zu den individuellen Universen vorgenommen werden kann.&amp;lt;br /&amp;gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Die beschriebenen Verfahren werden auf verschiedenen Datensätzen evaluiert. Diese&amp;lt;br /&amp;gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;umfassen einen molekularen Datensatz, bei dem basierend auf vier Universen die Aktivität von Molekülen vorherzusagen ist, sowie einen Datensatz von 3D Objekten, die in&amp;lt;br /&amp;gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;16 Universen beschrieben sind.</dcterms:abstract>
    <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/5755"/>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:alternative>Learning in Parallel Universes</dcterms:alternative>
    <dcterms:rights rdf:resource="http://creativecommons.org/licenses/by-nc-nd/2.0/"/>
    <dc:format>application/pdf</dc:format>
    <dcterms:issued>2008</dcterms:issued>
    <dcterms:title>Lernen in Parallelen Universen</dcterms:title>
    <dc:creator>Wiswedel, Bernd</dc:creator>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dc:rights>Attribution-NonCommercial-NoDerivs 2.0 Generic</dc:rights>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T15:59:50Z</dc:date>
    <dc:language>deu</dc:language>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
  </rdf:Description>
</rdf:RDF>
Interner Vermerk
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Kontakt
URL der Originalveröffentl.
Prüfdatum der URL
Prüfungsdatum der Dissertation
November 24, 2008
Finanzierungsart
Kommentar zur Publikation
Allianzlizenz
Corresponding Authors der Uni Konstanz vorhanden
Internationale Co-Autor:innen
Universitätsbibliographie
Begutachtet
Diese Publikation teilen