LZV Infrastruktur
Veraltende Dateiformate, nicht mehr unterstützte Anwendungssoftware und verwaiste digitale Infrastrukturen erfordern proaktive Erhaltungsaktivitäten, die in Management-Prozesse eingebettet sind. Nach einer umfassenden Evaluierung der am Markt verfügbaren technischen Systeme hat das hbz zusammen mit den Hochschulen des Landes die Software Rosetta als geeignete Lösung für diese Aufgaben identifiziert und eine umfassende Infrastruktur aufgebaut.
Was bietet Rosetta?
Die Software Rosetta der Firma Ex Libris ist konform zum international anerkannten OAIS-Modell und arbeitet mit verbreiteten Preservation Standards. Sie bietet unter anderem:
- Format Identification – Dateiformate werden anhand einer globalen Formatdatenbank (basierend auf PRONOM) erkannt und registriert
- Format Validation – Prüfung des Datenformats
- Risk Management – automatisierte Erkennung von Risiken für die die langfristige Nutzung
- Format Migration – Konvertierung gefährdeter Datenformate in langzeitstabile Formate
- Exit Strategy – Datenhaltung unabhängig von den Spezifika des Langzeit-Repositorys
- Plug-Ins – Standardisierte Einbindung von zusätzlicher Software
- Offene Schnittstellen – Interoperabilität mit Drittsystemen
Derzeit wird Rosetta in der Version 6.2 beim hbz produktiv eingesetzt. Die im hbz verfügbare Infrastruktur folgt den Empfehlungen der “Levels Of Digital Preservation" der NSDA.
Wie kann Rosetta genutzt werden?
Die Software ermöglicht die bibliotheks- und materialspezifische Einlieferung in einen Speicher, der entweder an eine
- zentral im hbz betriebene oder
- lokal installierte Rosetta-Infrastruktur angebunden ist.
Die spezifische Erhaltungsplanung für die Daten nutzt das Know-How einer globalen Community, das in international vernetzten Rosetta Working Groups gebündelt ist. Die Landeslösung des hbz verfügt über folgende Merkmale:
- hbz Sandbox – Zentrale Rosetta-Installation zur Einrichtung und zum Testen von Einlieferungen. Drei virtuelle Server (Red Hat Enterprise Linux 7), davon zwei für Rosetta und einer für eine Oracle Datenbank.
- hbz Produktionsumgebung – Skalierbares Cluster von neun virtuellen Servern auf vier Host-Maschinen, 80 Terabyte Operational Storage, mindestens 1,5 Petabyte Speicher als Hierarchical Storage Management System (HSM) mit Festplatten und Magnetbändern.
Die lokale Rosetta-Infrastruktur ist abhängig von lokalen Bedarfen konfigurierbar. Diese werden im Zuge einer Kooperation zusammen mit der teilnehmenden Einrichtung ermittelt.