Automatische Indexierung und ihre Anwendung im DFG-Projekt 'Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)'

Lade...
Vorschaubild
Dateien
scherer.pdf
scherer.pdfGröße: 2.77 MBDownloads: 814
Datum
2003
Autor:innen
Herausgeber:innen
Kontakt
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
DOI (zitierfähiger Link)
ArXiv-ID
Internationale Patentnummer
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Open Access Green
Core Facility der Universität Konstanz
Gesperrt bis
Titel in einer weiteren Sprache
Automatic Indexing and the application in the DFG-Project 'The joint internet portal for libraries, archives and museums (BAM)'
Forschungsvorhaben
Organisationseinheiten
Zeitschriftenheft
Publikationstyp
Masterarbeit/Diplomarbeit
Publikationsstatus
Published
Erschienen in
Zusammenfassung

Automatische Indexierung verzeichnet schon seit einigen Jahren aufgrund steigender Informationsflut ein wachsendes Interesse. Allerdings gibt es immer noch Vorbehalte gegenüber der intellektuellen Indexierung in Bezug auf Qualität und größerem Aufwand der Systemimplementierung bzw. -pflege. Neuere Entwicklungen aus dem Bereich des Wissensmanagements, wie beispielsweise Verfahren aus der Künstlichen Intelligenz, der Informationsextraktion, dem Text Mining bzw. der automatischen Klassifikation sollen die automatische Indexierung aufwerten und verbessern. - Die Masterarbeit stellt Grundlagen und Verfahren der automatischen Indexierung sowie neueren Entwicklungen auch Möglichkeiten der Evaluation dar. Die mögliche Anwendung der automatischen Indexierung im DFG-Projekt 'Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)' bilden den Schwerpunkt der Arbeit. Im Portal steht die bibliothekarische Erschließung von Texten im Vordergrund. In einem umfangreichen Test wurden drei deutsche, linguistische Systeme mit statistischen Verfahren kombiniert (bei einem System bereits integriert) und evaluiert, allerdings nur auf der Basis der ausgegebenen Indexate. - Abschließend kann festgestellt werden, dass die Ergebnisse und damit die Qualität (bezogen auf die Indexate) von intellektueller und automatischer Indexierung noch signifikant unterschiedlich sind. Die Gründe liegen in noch zu lösenden semantischen Problemen bzw. in der Übereinstimmung mit Worten aus einem Thesaurus, die von einem automatischen Indexierungssystem nicht immer nachvollzogen werden kann. Eine Inhaltsanreicherung mit den Indexaten zum Vorteil beim Retrieval kann, je nach System oder auch über die Einbindung durch einen Thesaurus, erreicht werden.

Zusammenfassung in einer weiteren Sprache

Automatic indexing has been getting more and more attention over the last few years due to increasing amounts of information on the subject. But many people still have reservations because of quality issues and because of the increased expenditure required for the implementation of the system and support. New developments in the area of knowledge management, such as methods from Artificial Intelligence, Information Extraction, Text Mining and automatic classification, should enhance and improve automatic indexing. - This master thesis demonstrates the basics and methods of future developments in automatic indexing and possibilities for evaluation. The main focus will be on possible uses of automatic indexing in the DFG-Project: 'The joint internet portal for libraries, archives and museums (BAM)'. In this portal, the emphasis is on the document representation of the libraries. In an extensive test, three German linguistic systems are combined with statistical methods (in one system already part of the system itself) and evaluated against each other, but only on the basis of the index terms. - To conclude, there are still significant differences between the results (and therefore the quality) for human indexing and for automatic indexing. This is due to semantic problems and problems in the word consistency in comparison to a controlled vocabulary, which causes problems for automatic indexing in catching the 'right' word. A content enrichment with the index terms, which is good for the retrieval process, is possible depending on the used system and the integration of a controlled vocabulary.

Fachgebiet (DDC)
004 Informatik
Schlagwörter
Automatic Indexing, Library, Archive, Museum, Indexing
Konferenz
Rezension
undefined / . - undefined, undefined
Zitieren
ISO 690SCHERER, Birgit, 2003. Automatische Indexierung und ihre Anwendung im DFG-Projekt 'Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)' [Master thesis]
BibTex
@mastersthesis{Scherer2003Autom-5735,
  year={2003},
  title={Automatische Indexierung und ihre Anwendung im DFG-Projekt 'Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)'},
  author={Scherer, Birgit}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/5735">
    <dc:contributor>Scherer, Birgit</dc:contributor>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/5735/1/scherer.pdf"/>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/5735/1/scherer.pdf"/>
    <dcterms:issued>2003</dcterms:issued>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:title>Automatische Indexierung und ihre Anwendung im DFG-Projekt 'Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)'</dcterms:title>
    <dcterms:alternative>Automatic Indexing and the application in the DFG-Project 'The joint internet portal for libraries, archives and museums (BAM)'</dcterms:alternative>
    <dc:language>deu</dc:language>
    <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T15:59:41Z</dc:date>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T15:59:41Z</dcterms:available>
    <dc:creator>Scherer, Birgit</dc:creator>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:abstract xml:lang="deu">Automatische Indexierung verzeichnet schon seit einigen Jahren aufgrund steigender Informationsflut ein wachsendes Interesse. Allerdings gibt es immer noch Vorbehalte gegenüber der intellektuellen Indexierung in Bezug auf Qualität und größerem Aufwand der Systemimplementierung bzw. -pflege. Neuere Entwicklungen aus dem Bereich des Wissensmanagements, wie beispielsweise Verfahren aus der Künstlichen Intelligenz, der Informationsextraktion, dem Text Mining bzw. der automatischen Klassifikation sollen die automatische Indexierung aufwerten und verbessern. - Die Masterarbeit stellt Grundlagen und Verfahren der automatischen Indexierung sowie neueren Entwicklungen auch Möglichkeiten der Evaluation dar. Die mögliche Anwendung der automatischen Indexierung im DFG-Projekt 'Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)' bilden den Schwerpunkt der Arbeit. Im Portal steht die bibliothekarische Erschließung von Texten im Vordergrund. In einem umfangreichen Test wurden drei deutsche, linguistische Systeme mit statistischen Verfahren kombiniert (bei einem System bereits integriert) und evaluiert, allerdings nur auf der Basis der ausgegebenen Indexate. - Abschließend kann festgestellt werden, dass die Ergebnisse und damit die Qualität (bezogen auf die Indexate) von intellektueller und automatischer Indexierung noch signifikant unterschiedlich sind. Die Gründe liegen in noch zu lösenden semantischen Problemen bzw. in der Übereinstimmung mit Worten aus einem Thesaurus, die von einem automatischen Indexierungssystem nicht immer nachvollzogen werden kann. Eine Inhaltsanreicherung mit den Indexaten zum Vorteil beim Retrieval kann, je nach System oder auch über die Einbindung durch einen Thesaurus, erreicht werden.</dcterms:abstract>
    <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/5735"/>
    <dc:format>application/pdf</dc:format>
    <dc:rights>terms-of-use</dc:rights>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
  </rdf:Description>
</rdf:RDF>
Interner Vermerk
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Kontakt
URL der Originalveröffentl.
Prüfdatum der URL
Prüfungsdatum der Dissertation
Finanzierungsart
Kommentar zur Publikation
Allianzlizenz
Corresponding Authors der Uni Konstanz vorhanden
Internationale Co-Autor:innen
Universitätsbibliographie
Begutachtet
Diese Publikation teilen