Formatvalidierung bei Forschungsdaten: Wann - und wozu?

  • Die Identifizierung und Validierung von Dateiformaten beim Ingest in ein Langzeitarchiv funktioniert gut für Files aus Digitalisierungsprojekten mit wenigen, gut dokumentierten Formaten. Probleme können oft im eigenen Haus zurückgemeldet werden, um z.B. fehlerhafte Files zu ersetzen.Forschungsdaten stammen dagegen von individuellen Produzentinnen und liegen in verschiedensten Formaten vor, die oft nicht ausreichend dokumentiert sind. Diese Ausgangslage wirft Fragen auf: Zu welchem Zeitpunkt sollen Forschende eine Rückmeldung zum Ergebnis der Formatidentifizierung und -validierung erhalten, damit sie eine angemessene Handlungsoption haben? Inwiefern haben sie überhaupt Interesse und Möglichkeit, auf eine Warnung zu reagieren? Sind Files korrupt und nicht nutzbar, müssen sie offensichtlich ersetzt werden. Handelt es sich dagegen um Validierungsprobleme, die die heutige Nutzbarkeit nicht beeinträchtigen, ist der Handlungsbedarf schwer zu erklären, der den Zusatzaufwand rechtfertigen müsste.Erfolgt die Formatvalidierung erst beim Ingest, ist der Austausch von Files durch die Datenproduzentin zudem bereits erschwert, da das Langzeitarchiv dies - korrekterweise - nur beschränkt zulässt.Brauchen interessierte Forschende also bereits in ihrer Arbeitsumgebung Werkzeuge, um Dateien vor der Langzeitarchivierung zu überprüfen? Ist die Zwischenschaltung eines „Arbeitsrepositoriums“ nötig, das eine Formatvalidierung vornimmt und interessierten Forschenden eine Rückmeldung gibt? Liefern die verfügbaren Tools ausreichend klare Angaben zum Problem und zur möglichen Behebung?Wo dies nicht der Fall ist oder das Interesse fehlt, ist nur eine Bitstromerhaltung realistisch und in der Tat sind nicht wenige Forschende der Meinung, dass es ohnehin ihre Aufgabe sein wird, Daten bei Bedarf wieder nutzbar zu machen. Der Vortrag legt die Problematik anhand konkreter Workflows dar und diskutiert mögliche Lösungsansätze.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Matthias Töwe
URN:urn:nbn:de:0290-opus4-29630
Parent Title (German):TK 5: Fokus Lehre und Forschung / Infrastrukturen für Forschungsdaten ( 01.06.2017, 16:00 - 18:00 Uhr, Raum Panorama 1 )
Title Additional (English):Format validation of Research data: When and why?
Document Type:Conference publication (Presentation slides)
Language:German
Year of Completion:2017
Release Date:2017/05/23
Tag:Formatidentifizierung; Formatvalidierung; Forschungsdaten; Langzeitarchivierung
Digital Preservation; Format Identification; Format Validation; Research Data
Themes:Elektronische Publikationen, elektronisches Publizieren, Forschungsdaten, Open Access
German Bibliothekartage / BiblioCon:106. Deutscher Bibliothekartag in Frankfurt am Main 2017
106. Deutscher Bibliothekartag in Frankfurt am Main 2017 / Themenkreise / TK 5: Fokus Lehre und Forschung / Infrastrukturen für Forschungsdaten
Licence (German):License LogoCreative Commons - Namensnennung-Weitergabe unter gleichen Bedingungen
Einverstanden
Diese Webseite verwendet technisch erforderliche Session-Cookies. Durch die weitere Nutzung der Webseite stimmen Sie diesem zu. Unsere Datenschutzerklärung finden Sie hier.