Compact Storage for Efficient Management of XML Documents

Lade...
Vorschaubild
Dateien
Thesis_Alkhatib.pdf
Thesis_Alkhatib.pdfGröße: 6.81 MBDownloads: 626
Datum
2010
Autor:innen
Alkhatib, Ramez
Herausgeber:innen
Kontakt
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
DOI (zitierfähiger Link)
ArXiv-ID
Internationale Patentnummer
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Open Access Green
Core Facility der Universität Konstanz
Gesperrt bis
Titel in einer weiteren Sprache
Kompakte Speicherung für die effiziente Verwaltung von XML-Dokumenten
Forschungsvorhaben
Organisationseinheiten
Zeitschriftenheft
Publikationstyp
Dissertation
Publikationsstatus
Published
Erschienen in
Zusammenfassung

XML wird mehr und mehr für Datenaustausch und -manipulation genutzt. Viele Ansätze verarbeiten XML-Daten im Hauptspeicher. Weil XML zunehmend häufig verwendet wird und die XML-Syntax zusätzlichen Speicher benötigt, können grössere XML-Dateien nicht im Hauptspeicher verarbeitet werden. Infolgedessen leiden diese Dateien unter den Begrenzungen aktueller Arbeitsspeicher.
Hingegen werden objektrelationale Datenbanktechnologien wegen ihrer Ausgereiftheit und weiten Verbreitung als Alternativen zum Speichern und Verwalten von XML-Daten genannt. Die dauerhafte Speicherung von XML in seinem ursprünglichen Format vermeidet Verluste durch Umwandlung und stellt die beste Alternative dar.
Daraus folgt ein steigender Bedarf an robusten, leistungsfähigen XML-Datenbanken, die XML-Daten nicht nur effizient abfragen und aktualisieren, sondern sie auch kompakt speichern können.
Es gibt viele Ansätze zur Verwaltung von XML-Dokumenten. Hingegen sind zwei gängige Strategien bekannt, die eine robuste Speicherung und effiziente Suche gewährleisten.
Die erste beruht auf einem Nummerierungsschema, das strukturelle Informationen aus XML-Dokumenten gewinnt. Diese Informationen werden auf eine Art gespeichert, die schnelle Identifikation zwischen den Knotenbeziehungen erlaubt. Diese Identifikation spielt eine entscheidende Rolle bei der effizienten Abfrageverarbeitung.
Die zweite Strategie verkleinert XML-Dateien mittels Komprimierungstechniken. Während eine naive Darstellung von XML-Dateien eine starke Redundanz erzeugt, reduziert die Komprimierung von XML-Dateien nicht nur den benötigten Speicherplatz, sondern erhöht auch die Abfragegeschwindigkeit.
Die vorliegende Arbeit präsentiert verschiedene Lösungsansätze für die effiziente Verwaltung von XML-Daten. Sie stellt Ansätze vor, die die Stärken von Kennzeichnungs- und Komprimierungs-Technologien verbinden und sowohl die Lücke zwischen diesen Technologien schließen als auch ihre Nachteile überwinden und eine bessere Leistung als bei separatem Einsatz dieser Technologien gewährleisten.
Eine ausführliche experimentelle Evaluation der vorgestellten Anätze zeigt, dass sie im Vergleich mit anderen Ansätzen auf diesem Gebiet deutliche Leistungsverbesserungen bei der XML-Verarbeitung erzielen.
XML is becoming widely used for data exchange and manipulation. As a consequence, an increasing number of XML documents need to be managed. There are many works that use main-memory to process XML data. Since XML usage is continuing to grow and the nature of XML is extremely verbose, large or even moderately large XML documents cannot be processed within the main memory. Consequently, these works will suffer from the limitations of current main-memory.
On the other hand, because of the maturity and widespread deployment of (object) relational database technologies, they have been suggested as an alternative to store and manage XML data. However, the persistent storage of XML in its native format will avoid transformation cost and present the best alternative.

Zusammenfassung in einer weiteren Sprache

This has generated an increasing need for robust, high performance XML database systems, which are able to not only query and update XML data efficiently, but also store it in a compact representation.
There have been many proposals to manage XML documents. However, two common strategies are available to provide robust storage and efficient query processing.
The first is based on numbering schemes for gathering structural information from XML documents and storing it in such a way that allows quick identification of structural relationships between nodes. This identification plays a crucial role in efficient XML query processing.
The second strategy tries to reduce the size of XML documents through compaction techniques. While a naive representation of XML documents leads to excessive redundancy, the compaction of XML documents not only reduces the amount of disk space occupied by the data, but also enhances query processing speed.
The thesis presents different solutions for the efficient management of XML data by proposing approaches that combine the strengths of labeling and compaction technologies and bridge the gaps between these technologies to exploit their benefits and avoid their drawbacks and produce a performance that is better when these technologies are used independently.
An extensive experimental evaluation of the approaches proposed shows that they yield considerable performance improvements for XML processing compared to other approaches in this field.

Fachgebiet (DDC)
004 Informatik
Schlagwörter
XML Komprimierung, XML Anfrageverarbeitung, XML Nummerierungsschema, XML Compaction, XML Querying, XML Updating, XML Labeling Scheme
Konferenz
Rezension
undefined / . - undefined, undefined
Zitieren
ISO 690ALKHATIB, Ramez, 2010. Compact Storage for Efficient Management of XML Documents [Dissertation]. Konstanz: University of Konstanz
BibTex
@phdthesis{Alkhatib2010Compa-6289,
  year={2010},
  title={Compact Storage for Efficient Management of XML Documents},
  author={Alkhatib, Ramez},
  address={Konstanz},
  school={Universität Konstanz}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/6289">
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:11:11Z</dcterms:available>
    <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6289/1/Thesis_Alkhatib.pdf"/>
    <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/6289"/>
    <dc:format>application/pdf</dc:format>
    <dcterms:issued>2010</dcterms:issued>
    <dc:language>eng</dc:language>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:11:11Z</dc:date>
    <dcterms:title>Compact Storage for Efficient Management of XML Documents</dcterms:title>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6289/1/Thesis_Alkhatib.pdf"/>
    <dcterms:abstract xml:lang="deu">XML wird mehr und mehr für Datenaustausch und -manipulation genutzt. Viele Ansätze verarbeiten XML-Daten im Hauptspeicher. Weil XML zunehmend häufig verwendet wird und die XML-Syntax zusätzlichen Speicher benötigt, können grössere XML-Dateien nicht im Hauptspeicher verarbeitet werden. Infolgedessen leiden diese Dateien unter den Begrenzungen aktueller Arbeitsspeicher.&lt;br /&gt;Hingegen werden objektrelationale Datenbanktechnologien wegen ihrer Ausgereiftheit und weiten Verbreitung als Alternativen zum Speichern und Verwalten von XML-Daten genannt. Die dauerhafte Speicherung von XML in seinem ursprünglichen Format vermeidet Verluste durch Umwandlung und stellt die beste Alternative dar.&lt;br /&gt;Daraus folgt ein steigender Bedarf an robusten, leistungsfähigen XML-Datenbanken, die XML-Daten nicht nur effizient abfragen und aktualisieren, sondern sie auch kompakt speichern können.&lt;br /&gt;Es gibt viele Ansätze zur Verwaltung von XML-Dokumenten. Hingegen sind zwei gängige Strategien bekannt, die eine robuste Speicherung und effiziente Suche gewährleisten.&lt;br /&gt;Die erste beruht auf einem Nummerierungsschema, das strukturelle Informationen aus XML-Dokumenten gewinnt. Diese Informationen werden auf eine Art gespeichert, die schnelle Identifikation zwischen den Knotenbeziehungen erlaubt. Diese Identifikation spielt eine entscheidende Rolle bei der effizienten Abfrageverarbeitung.&lt;br /&gt;Die zweite Strategie verkleinert XML-Dateien mittels Komprimierungstechniken. Während eine naive Darstellung von XML-Dateien eine starke Redundanz erzeugt, reduziert die Komprimierung von XML-Dateien nicht nur den benötigten Speicherplatz, sondern erhöht auch die Abfragegeschwindigkeit.&lt;br /&gt;Die vorliegende Arbeit präsentiert verschiedene Lösungsansätze für die effiziente Verwaltung von XML-Daten. Sie stellt Ansätze vor, die die Stärken von Kennzeichnungs- und Komprimierungs-Technologien verbinden und sowohl die Lücke zwischen diesen Technologien schließen als auch ihre Nachteile überwinden und eine bessere Leistung als bei separatem Einsatz dieser Technologien gewährleisten.&lt;br /&gt;Eine ausführliche experimentelle Evaluation der vorgestellten Anätze zeigt, dass sie im Vergleich mit anderen Ansätzen auf diesem Gebiet deutliche Leistungsverbesserungen bei der XML-Verarbeitung erzielen.&lt;br /&gt;XML is becoming widely used for data exchange and manipulation. As a consequence, an increasing number of XML documents need to be managed. There are many works that use main-memory to process XML data. Since XML usage is continuing to grow and the nature of XML is extremely verbose, large or even moderately large XML documents cannot be processed within the main memory.  Consequently, these works will suffer from the limitations of current main-memory.&lt;br /&gt;On the other hand, because of the maturity and widespread deployment of (object) relational database technologies, they have been suggested as an alternative to store and manage XML data. However, the persistent storage of XML in its native format will avoid transformation cost and present the best alternative.</dcterms:abstract>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:alternative>Kompakte Speicherung für die effiziente Verwaltung von XML-Dokumenten</dcterms:alternative>
    <dc:creator>Alkhatib, Ramez</dc:creator>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dc:contributor>Alkhatib, Ramez</dc:contributor>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dc:rights>terms-of-use</dc:rights>
  </rdf:Description>
</rdf:RDF>
Interner Vermerk
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Kontakt
URL der Originalveröffentl.
Prüfdatum der URL
Prüfungsdatum der Dissertation
February 19, 2010
Finanzierungsart
Kommentar zur Publikation
Allianzlizenz
Corresponding Authors der Uni Konstanz vorhanden
Internationale Co-Autor:innen
Universitätsbibliographie
Begutachtet
Diese Publikation teilen