Gefahr digitaler Löcher

Wenn sich eines Tages künftige Historiker mit der Gegenwart beschäftigen, könnten sie auf ein riesiges Informationsloch stoßen. Denn heutiges Kulturgut wird vor allem elektronisch gespeichert. Digitale Dokumente aber können schon nach wenigen Jahrzehnten nicht mehr gelesen werden.

In den Stadt- und Landesarchiven werden mittelalterliche Urkunden für Jahrhunderte aufbewahrt. Weit weniger langlebig sind elektronische Dokumente: Sie können zum Teil schon nach wenigen Jahrzehnten nicht mehr gelesen werden, weil die für sie bestimmte Software völlig veraltet ist. Auch die Hardware ist problematisch – so gibt es kaum noch eine Möglichkeiten, Disketten im ehedem weit verbreiten Format von 5,25 Zoll zu lesen. Ein jetzt erschienenes Buch macht sich Gedanken über die richtige Strategie der Lanzeitarchivierung elektronischer Dokumente.

„Da in zunehmendem Maße Kulturgüter in digitaler Form produziert werden, laufen wir Gefahr, schon bald Teile des zeitgenössischen Kulturguts endgültig zu verlieren“, warnen die vier Buchautoren Uwe Borghoff, Peter Rödig, Jan Scheffczyk und Lothar Schmitz. Da die künftige Entwicklung der Technik niemand absehen kann, betrachten sie die Langzeitarchivierung als Aufgabe, die von Generation zu Generation weitergegeben werden muss. Dabei gibt es zwei unterschiedliche Wege: Bei der Migration werden die älteren Dokumente neu gespeichert, damit sie auch im jeweils aktuellen Format zur Verfügung stehen.

Die Emulation hingegen bedient sich „virtueller Maschinen“, die die alten Betriebssysteme und Dateiformate weiter darstellen können. Die Autoren – alle vier Informatiker an der Universität der Bundeswehr in München – empfehlen, beide Ansätze miteinander zu kombinieren.

Was sollte man schon beim Erstellen von Dokumenten beachten, damit sie möglichst lange erhalten bleiben? Die Autoren plädieren hier für XML, weil die Kontrolle und alle Änderungsrechte bei diesem Format in den Händen eines internationalen Normungsgremiums liegen. Relativ gute Noten bekommt noch PDF, weil dieses von der Firma Adobe entwickelte Format zur allgemeinen Nutzung offen gelegt wurde. „Unbedingt zu vermeiden sind proprietäre Formate wie Microsoft Word, die von ihren Besitzern jederzeit geändert werden können“. Wegen der Vorteile offener Standards unterstützt auch die Microsoft-Software XML und kann Dokumente in diesem Format speichern.

Die Autoren regen eine enge Zusammenarbeit von Informatikern und Archivaren, Politikern und Juristen an, um gemeinsame Lösungsansätze zu entwickeln. Mit ihrem Buch stellen sie die Grundlagen für diesen Austausch zur Verfügung. Ein ausführlicher methodischer Teil beginnt mit Überlegungen zur „Konservierung von Zeichenströmen“ und leitet hin zur Darstellung von Dokumentbeschreibungssprachen.

Ein zweiter Praxis-Teil stellt dann bestehende XML-und Datenbankprojekte vor wie die bereits intensiv von Bibliotheken genutzte Dublin-Core-Initiative. Für die Emulation schließlich könnte es einmal einen „Universal Virtual Computer“ (UVC) geben. Für diesen sollen Programme erstellt werden, mit denen der Bitstrom von Daten direkt ausgelesen werden kann, ohne dass dafür die gesamte Erstellungssoftware mit archiviert werden muss. Allerdings steckt das UVC-Projekt noch in einer frühen Experimentierphase.

Info:
Uwe M. Berghoff, Peter Rödig, Jan Scheffczyk, Lothar Schmitz:
Langzeitarchivierung. Methoden zur Erhaltung digitaler Dokumente.
Heidelberg: dpunkt.verlag 2003. 283 Seiten. 45 Euro

Quelle: RP-Online, 4.11.2003

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.