Selbst heute in Zeiten von E-Mail und Internet ist Papier ein wichtiger Geheimnisträger. Weitaus mehr galt das noch in der ehemaligen DDR. Deshalb sollten heikle Akten der Staatssicherheit in einer Nacht- und Nebelaktion im Herbst 1989 vernichtet werden. Das Ergebnis: In 16 250 Säcken lagern bis heute schätzungsweise 45 Millionen der damals zerrissenen Dokumente. Im Auftrag der Bundesbehörde für die Unterlagen des Staatssicherheitsdienstes der ehemaligen DDR BStU soll das Fraunhofer-Institut für Produktionsanlagen und Konstruktionstechnik IPK in Berlin nun dieses gigantische Puzzle zusammensetzen. In einem Pilotprojekt wird in den nächsten zwei Jahren der Inhalt aus 400 Säcken automatisiert rekonstruiert.
Um die Geheimnisse des DDR-Regimes zu bewahren, wurden zwischen Herbst 1989 und Januar 1990 im ehemaligen Ministerium für Staatssicherheit systematisch Akten vorvernichtet. Die Menge der Dokumente war so enorm, dass die Reißwölfe ausfielen. Ein großer Teil der Unterlagen musste per Hand zerrissen werden. Geschätzte 45 Millionen DIN-A4 Seiten wurden in je 8 bis 30 Teile zerlegt. Bisher gelang es nur einen geringen Teil dieser Dokumente zu rekonstruieren. Denn das manuelle Zusammensetzen ist sehr zeitintensiv. Um die etwa 600 Millionen Papierschnipsel von Hand zusammenzufügen, würden 30 Personen 600 bis 800 Jahre benötigen. Forscher des IPK können das weitaus schneller: Sie entwickelten ein computergestütztes Verfahren, um das Schnipselpuzzle zu automatisieren und somit eine zeitnahe Auswertung der Unterlagen zu ermöglichen. Bereits 2003 wurde die Machbarkeit dieses virtuellen Puzzelns demonstriert. Nun startet das Pilotprojekt für die rechnerbasierte Rekonstruktion.
Bevor das virtuelle Puzzeln losgehen kann, müssen die Schnipsel beidseitig digitalisiert werden. Diesen Scanprozess übernimmt die zur Bertelsmann AG gehörende arvato direct services GmbH. Seit 2005 arbeiten arvato direct services und das IPK zusammen an der Digitalisierung von unterschiedlichen Dokumenten, insbesondere für Anwendungen im Behördenmarkt und in der Finanzbranche. Während dieser Kooperation, die vom Land Berlin gefördert wird, entstanden neuartige Scankonzepte, die nun bei der Digitalisierung der Schnipsel zum Einsatz kommen. »Das virtuelle Puzzeln folgt der Logik des manuellen Puzzelns«, erklärt Dr. Bertram Nickolay, Abteilungsleiter am IPK. Der Mensch verwendet für die Lösung dieses Geduldsspiels eine Vielzahl von Merkmalen, anhand derer er entscheidet, ob zwei Teile zueinander passen oder nicht – die Form der Teile oder welche Farbe oder Schrift auf den Puzzlestücken zu erkennen ist. Diese Vorauswahl macht das Suchen und Finden passender Puzzlestücke leichter. »Auch der virtuelle Puzzleprozess beginnt so«, sagt Nickolay. »Das System berechnet verschiedene beschreibende Merkmale wie Form oder Textur, um den Suchraum zu reduzieren. Innerhalb dieser kleineren Menge erfolgt die eigentliche Rekonstruktion.« Dafür werden Schnipsel entlang ihrer Konturen auf Übereinstimmungen hin verglichen. Sind passende Teile gefunden, werden sie zu einem größeren Dokument zusammengefasst. Dann beginnt der Vorgang von vorn. Schnipsel für Schnipsel entsteht so wieder Seite für Seite der Stasiakten.
Die Forscher am IPK sind schon einen Schritt weiter mit der Entwicklung ihrer Technologie als 2003: Ihre Algorithmen können inzwischen nicht nur von Hand zerrissene Unterlagen, sondern auch geschredderte Papiere wieder zusammensetzen. Das ist besonders kompliziert, da bei maschinell zerkleinerten Dokumenten ein wesentliches Merkmal des Puzzelns – die Form – nicht zur Verfügung steht. Stattdessen müssen Buchstabenteile als Merkmale herangezogen werden. So konnte beispielsweise für eine Steuerfahndungsbehörde ein Sack mit geschredderten Dokumenten vollständig rekonstruiert werden.
Kontakt:
Fraunhofer-Institut für Produktionsanlagen und Konstruktionstechnik IPK
Dr. Bertram Nickolay
Pascalstraße 8 – 9
10587 Berlin
Tel.: 0 30 / 39 006 – 201
Fax: 030 / 39 175 – 17
Quelle: Presseinformation Fraunhofer-Gesellschaft, 9.5.2007; Judith Regner, Wiener Zeitung Online, 10.5.2007