Ratgeber - Verbrauchertipps

Digitalisierung Einsen und Nullen für die Ewigkeit?

In der Bayerischen Staatsbibliothek werden Hunderttausende Bücher eingescannt. Die oft mehrere hundert Jahre alten Werke sollen so vor dem Verfall bewahrt werden. Doch wie haltbar sind digitale Daten eigentlich?

Stand: 13.02.2012
"Historiae adversus paganos" ( ca. 1475) geht über in Reihen von Einsen und Nullen | Bild: Bayerische Staatsbibliothek, Montage: BR

Zahlreiche, vor allem ältere Werke aus dem riesigen Bestand der Bayerischen Staatsbibliothek (BSB) in München bekommt man nur im Lesesaal zu sehen. Andere sind Normalsterblichen gar nicht zugänglich. Zu kostbar und zu anfällig sind manche der ehrwürdigen "Schinken", als dass sie dem im Lesesaal üblichen Gebrauch etwa durch Studenten auf Dauer standhalten würden. Es sind jahrhunderte alte Handschriften und Drucke aus dem 18. und 19. Jahrhundert, darunter zum Beispiel Wolfram von Eschenbachs Parzival und das Nibelungenlied.

Luftbefeuchter am Scanner

Fragment aus Wolfram von Eschenbachs Parzival aus dem 14. Jahrhundert: Löchriges Papier, verblasste Schrift.

Um auch diese Werke einer breiteren Öffentlichkeit zugänglich zu machen, werden sie in der digitalen Sammlung der BSB archiviert. Das heißt, sie werden eingescannt, als digitale Kopien gespeichert und ins Internet gestellt. Schon seit 15 Jahren sitzen in der BSB Menschen an großen, bücherschonenden Scangeräten, die preislich teils in der Klasse eines Luxus-Autos liegen. Die Bücher werden nicht wie bei handelsüblichen Scannern zwischen zwei Platten eingequetscht, sondern liegen nach oben offen auf einer Ablage. Von oben werden sie abfotografiert. Luftbefeuchter halten das Hygrometer auf einem konstanten Stand, denn zu trockene oder zu feuchte Luft könnte das empfindliche Material beschädigen.

Tausend Jahre alte Werke

Online stöbern

Mittels Schrifterkennungssoftware ist in den meisten Büchern über die Website der "Stabi" bereits eine Volltextsuche möglich. Das heißt, es kann wie in einem digitalen Textdokument oder auf einer Website nach einem bestimmten Wort gesucht werden - ein ungeheurer Vorteil bei der wissenschaftlichen Recherche. Durch ein Crowdsourcing-Projekt, in dem wissensbegeisterte Nutzer auf einem Web-Portal Stück für Stück der handfschriftlichen Werke transkribieren, soll dies bald auch für handgeschriebene Werke ermöglicht werden.

Markus Brantl, der das Digitalisierungszentrum in der BSB leitet, erklärt, warum so ein Aufwand getrieben wird: "Das älteste deutsche Sprachdokument der Welt, das Wessobrunner Gebet, wird hier gerade digitalisiert." Besagtes Dokument hat über tausend Jahre auf dem Buckel. Das Papier ist brüchig, die Schrift stellenweise stark ausgeblichen. Alles muss stimmen, um diese historische Kostbarkeit nicht weiter zu strapazieren. In ein bis zwei Jahren soll das Projekt abgeschlossen sein. Dann soll der gesamte urheberrechtsfreie Bestand an Werken der "Stabi" digitalisiert sein, rund eine Million Werke. Gespeichert werden sie im TIF-Format, einem offenen und weit verbreiteten Dateiformat, das laut Brantl gewährleistet, dass die Daten eines Tages in ein anderes Format überführt werden können. Das könnte nötig werden, wenn der Standard TIF in Zukunft ein Auslaufmodell wird.

Frischzellenkur für Datenträger

Datenträger im Wandel

Genauso wichtig wie die Wahl eines robusten Speichermediums ist, technisch am Ball zu bleiben. Denn Dateiformate wie auch Schnittstellen vom Speicher zum Rechner veralten. Wer zum Beispiel von einer 5,25-Zoll-Diskette, die er einst mit seinem C64-Computer beschrieben hat, Daten herunterladen will, muss für ein passendes Lesegerät höchstwahrscheinlich ins Museum gehen.

Doch nicht nur Dateiformate, auch Speichermedien wie Festplatten oder DVDs sind nicht für die Ewigkeit bestimmt. Drei mal mussten die Rohdaten der Digitalen Sammlung der BSB, die im Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften lagern, dort schon auf neue Server umziehen. Die Einsen und Nullen des digitalen Codes, der als Abstraktion etwa des Parzivals und des Nibelungenlieds auf den Festplatten dieser Server gespeichert ist, braucht alle paar Jahre eine Frischzellenkur. Sonst würde er Gefahr laufen, durcheinander zu geraten und dadurch unlesbar zu werden. Denn mehr als 1.000 Jahre, wie sie das Papier des Wessobrunner Gebets überdauert hat, sind für digitale Speichermedien nach wie vor völlig illusorisch.

Platten, Karten, Scheiben und ihre Lebensdauer ...