1、November 2011DEUTSCHE NORM Normenausschuss Bibliotheks- und Dokumentationswesen (NABD) im DINPreisgruppe 13DIN Deutsches Institut fr Normung e. V. Jede Art der Vervielfltigung, auch auszugsweise, nur mit Genehmigung des DIN Deutsches Institut fr Normung e. V., Berlin, gestattet.ICS 01.140.20; 35.240
2、.30!$tup“1818277www.din.deDDIN 31645Information und Dokumentation Leitfaden zur Informationsbernahme in digitale LangzeitarchiveInformation and documentation Guide to the transfer of information objects into digital long-term archivesInformation et documentation Guide pour la prise en charge dinform
3、ation dans les archives lectroniques long termeAlleinverkauf der Normen durch Beuth Verlag GmbH, 10772 Berlin www.beuth.deGesamtumfang 25 SeitenDIN 31645:2011-11 Inhalt Seite Vorwort . 4 Einleitung 5 1 Anwendungsbereich 6 2 Normative Verweisungen. 6 3 Begriffe 6 4 Objekte. 9 4.1 Auswahl der zu archi
4、vierenden Informationen 9 4.1.1 Allgemeines. 9 4.1.2 Auswahl der Informationsobjekte. 9 4.1.3 Analyse des Datenexports. 9 4.1.4 Problemlsung Anpassung der Informationsobjekte“ . 10 4.2 Auswahl der Metadaten 10 4.2.1 Allgemeines. 10 4.2.2 Definition der Metadaten 11 4.2.3 Verantwortlichkeit fr die Me
5、tadaten11 4.3 Identifikation von signifikanten Eigenschaften der Informationsobjekte. 12 4.3.1 Allgemeines. 12 4.3.2 Definition der signifikanten Eigenschaften 12 4.3.3 Verzeichnung und Dokumentation der signifikanten Eigenschaften 12 5 Prozesse 13 5.1 Definition von Transferpaketen. 13 5.1.1 Allgem
6、eines. 13 5.1.2 Festlegung der Verhltnisse 13 5.1.3 Struktur der Paketinhalte . 13 5.1.4 Identifizierung des Pakets . 14 5.2 Validierung 14 5.2.1 Allgemeines. 14 5.2.2 Definition der Validierungsprozesse und ihrer Erfllungsgrade. 14 5.2.3 Beteiligte Personen und Hilfsmittel 14 5.2.4 Zeitliche Abfolg
7、e der Validierungsprozesse 14 5.3 Transfer von Daten aus dem Produzentensystem 15 5.3.1 Allgemeines. 15 5.3.2 Analyse der Rahmenbedingungen 15 5.3.3 Prfung der Infrastrukturen. 15 5.3.4 Implementierung des Transferprozesses 15 6 Management 16 6.1 Identifikation der rechtlichen und vertraglichen Bedi
8、ngungen . 16 6.1.1 Allgemeines. 16 6.1.2 Identifizierung der Akteure aus rechtlicher Sicht 16 6.1.3 Bestimmung der Art der rechtlichen Beziehungen. 16 6.1.4 Bestimmung des Inhalts der rechtlichen Regelungen 16 6.1.5 Bestimmung des urheberrechtlichen Status der Informationsobjekte. 17 6.1.6 Regelung
9、von Haftung und Gewhrleistung 17 6.2 bernahmevereinbarung und Dokumentation 17 6.2.1 Abschluss einer bernahmevereinbarung 17 6.2.2 Protokoll der bernahme. 18 6.3 Kosten und Personal 18 6.3.1 Allgemeines. 18 6.3.2 Kostenabschtzung 18 6.3.3 Personalabschtzung. 18 2 DIN 31645:2011-11 Seite Anhang A (no
10、rmativ) bersicht ber die Planungsschritte der Informationsbernahme 19 Anhang B (informativ) Beispiele zu Metadatenstandards 22 B.1 Inhaltsbeschreibende Metadaten (Beispiele zu 4.2.2) .22 B.2 Technische- und strukturbeschreibende Metadaten (Beispiele zu 4.2.2) .22 B.3 Klassifizierung signifikanter Ei
11、genschaften (Beispiel zu 4.3) 23 Literaturhinweise24 3 DIN 31645:2011-11 Vorwort Fr das vorliegende Dokument ist der NA 009-00-15 AA Schriftgutverwaltung und Langzeitverfgbarkeit digitaler Informationsobjekte“ verantwortlich. Es wurde vom zustndigen Arbeitskreis NA 009-00-15-05 AK Ingest“ erarbeitet
12、. Es wird auf die Mglichkeit hingewiesen, dass einige Texte dieses Dokuments Patentrechte berhren knnen. Das DIN und/oder die DKE sind nicht dafr verantwortlich, einige oder alle diesbezglichen Patentrechte zu identifizieren. 4 DIN 31645:2011-11 Einleitung Die Informationsbernahme in digitale Langze
13、itarchive ist ein kritischer Prozess innerhalb der gesamten Langzeitarchivierung. Ein Grund ist, dass er blicherweise besonders kostenintensiv ist, da in ihm erst die Grundlage fr eine sptere automatisierte und effiziente Verarbeitung der digitalen Daten gelegt wird. Aus Sicht der Daten sind es beso
14、ndere Anfangsinvestitionen, die whrend der Informationsbernahme notwendig werden. Ein weiterer Grund fr die Wichtigkeit dieses Prozesses ist, dass er besondere Konsequenzen fr die Qualitt hat. Ein digitales Langzeitarchiv wird Anfangsfehler meist nur selten verbessern oder rckgngig machen knnen und
15、sie wirken sich auf den gesamten Archivierungszeitraum aus. Aus dieser Situation ist ein Bedrfnis nach Information, Anleitung und Standardisierung fr die Informa-tionsbernahme in digitale Langzeitarchive erwachsen, auf das diese Norm antwortet. Sie behandelt nicht nur die Anforderungen an das digita
16、le Langzeitarchiv, sondern auch Anforderungen an den Produzenten bzw. Lieferanten der zu bewahrenden Daten. Die Produzenten bzw. Lieferanten spielen eine wichtige Rolle im bernahmeprozess, verfgen aber diesbezglich meist ber weniger Kenntnisse als die Betreiber von digitalen Langzeitarchiven. Wesent
17、liche Aufgaben einer bernahme werden in dieser Norm aufgefhrt und anhand von Anmerkungen und Beispielen nher beschrieben und begrndet. Die Anwender dieser Norm sind aufgefordert, die Aufgabenliste innerhalb ihres bernahmeprojekts abzuarbeiten. Zur praktischen Hilfestellung befindet sich eine Kontrol
18、lliste im Anhang, in der alle Schritte einer DIN 31645 konformen bernahme zusammengefasst sind. Bei der Anwendung der Norm ist zu beachten, dass die einzelnen Aufgaben nicht in der aufgefhrten Reihenfolge nacheinander abgearbeitet werden mssen. 5 DIN 31645:2011-11 1 Anwendungsbereich Diese Norm gibt
19、 organisatorische Leitlinien fr die bernahme von Informationen aus einem Informations-system in ein Langzeitarchiv unter Wahrung der Datenintegritt und Authentizitt vor. Anfallende Aufgaben fr den Produzenten und das digitale Langzeitarchiv werden in Planungsschritten benannt und in allgemeiner Form
20、 beschrieben. Die Informationsbernahme in ein digitales Langzeitarchiv ist nicht nur ein rein technischer Transfer zwischen zwei Systemen, sondern ein Prozess mit vielen organisatorischen Anforderungen, an dessen Ende die bernahme der Verantwortung durch das digitale Langzeitarchiv steht. Informatio
21、nsobjekte mssen aus blicherweise heterogenen technischen und organisatorischen Kontexten so bernommen werden, dass sie trotzdem in ganz anderen, zuknftigen Kontexten und sich ndernden technischen Umgebungen verstehbar und nutzbar sein werden. Ein Langzeitarchiv ist dabei nicht nur ein technisches Sy
22、stem, sondern auch eine organisatorische Einheit oder Institution. Ein digitales Langzeitarchiv kann Bestandteil einer greren Einrichtung sein, die auch analoge Bestnde archiviert. Die Zusammenhnge zwischen digitalen und analogen Bestnden sollten gewahrt und bei der Nutzung entsprechend dargestellt
23、werden. Diese Norm gilt fr Vorhaben, in denen Informationsbernahmen in ein digitales Langzeitarchiv geplant und durchgefhrt werden. Sie bezieht sich sowohl auf einmalige Informationsbernahmen wie auch auf den Aufbau von Prozessen zur wiederholten, automatisierten Informationsbernahme. Eine bernahme
24、ist konform zu dieser Norm, wenn die Beteiligten alle Planungsschritte des normativen Teils (Abschnitt 4 bis Abschnitt 6) ausreichend bercksichtigt haben. 2 Normative Verweisungen Die folgenden zitierten Dokumente sind fr die Anwendung dieses Dokuments erforderlich. Bei datierten Verweisungen gilt n
25、ur die in Bezug genommene Ausgabe. Bei undatierten Verweisungen gilt die letzte Ausgabe des in Bezug genommenen Dokuments (einschlielich aller nderungen). E DIN 31644:2010-08, Information und Dokumentation Kriterien fr vertrauenswrdige digitale Langzeit-archive ISO 14721:2003, Space data and informa
26、tion transfer systems Open archival information system Reference model 3 Begriffe Fr die Anwendung dieses Dokuments gelten die folgenden Begriffe. 3.1 Archivpaket (en: Archival Information Package - AIP) Paket, das im digitalen Langzeitarchiv gespeichert wird ANMERKUNG Konzeptionelle Einheit aus ISO
27、 14721:2003. 3.2 Authentizitt die zu archivierende Information wurde seit Beginn des bernahmeverfahrens in das Langzeitarchiv nicht verndert ANMERKUNG Authentizitt beinhaltet, dass nur beabsichtigte, dokumentierte Vernderungen im Sinne der Erhaltungsmanahmen am Objekt durchgefhrt wurden. Mastab fr d
28、ie Authentizitt sind die signifikanten Eigenschaften des Informationsobjekts. 6 DIN 31645:2011-11 3.3 (digitale) Daten digitale Reprsentation von Information in einer formalisierten Art, die die Interpretation, Verarbeitung bzw. den Austausch erlaubt E DIN 31644:2010-08 ANMERKUNG Daten knnen in Form
29、 von Dateien technisch selbstndige Einheiten bilden oder technisch unselbst-stndig als Bitsequenzen vorliegen. 3.4 digitales Langzeitarchiv dLZA eine Organisation (bestehend aus Personen und technischen Systemen), die die Verantwortung fr den Langzeiterhalt und die Langzeitverfgbarkeit von Informati
30、on in digitaler Form sowie die Bereitstellung fr eine bestimmte Zielgruppe bernommen hat ANMERKUNG Digitale Langzeitarchive bewahren fr den Menschen les- und interpretierbare Informationen, die in digitaler Form gespeichert werden. Im vorliegenden Kontext bedeutet Langzeit, dass Vernderungen in der
31、Technik (Soft-und Hardware) und in der Zielgruppe bercksichtigt werden. Langzeit kann bereits ein Zeitraum von 10 30 Jahren sein, oder aber fr knftige Generationen, auf unbegrenzte Zeit. 3.5 Emulation eine Strategie zur Erhaltung der Langzeitverfgbarkeit von Reprsentationen ANMERKUNG Die Strategie s
32、ieht vor, dass die Systemvoraussetzungen, die zur Nutzung lterer Reprsentationen notwendig sind, durch spezialisierte Software auf aktuellen marktgngigen Systemen nachgebildet (emuliert) werden knnen. Die Reprsentationen selbst werden dabei mglichst unverndert erhalten. 3.6 Information jeder Typ von
33、 Wissen, der ausgetauscht werden kann, aus inhaltlicher Sicht ANMERKUNG Z. B. Werke geistiger Schpfung, Ergebnisse der Forschung und Entwicklung, Dokumentationen des politischen, sozialen und wirtschaftlichen Handelns. Information an sich ist logisch und zunchst ohne definierte Abgrenzung. Zur Archi
34、vierung muss zunchst die interessierende Informationseinheit abgegrenzt, d. h. als logisches Objekt konstituiert werden. Das so gebildete Informationsobjekt muss dann von einem Computer durch greifbare Einheiten reprsentiert werden, die dann ihrerseits durch Reprsentationen begrenzt werden. Dies kan
35、n auf verschiedene Weisen, d. h. mit unterschiedlichen Reprsentationen, geschehen. 3.7 Informationsobjekt logisch abgegrenzte Informationseinheit 3.8 Integritt Vollstndigkeit und Unversehrtheit der Daten, d. h. dass diese weder absichtlich noch unabsichtlich, noch durch einen technischen Fehler vern
36、dert oder zerstrt wurden 3.9 Metadaten Informationen zur Beschreibung der Eigenschaften von Informationsobjekten und ihren Reprsentationen ANMERKUNG In Anlehnung an DIN ISO 15489:2002 7 DIN 31645:2011-11 3.10 Migration (Dateiformat) beinhaltet das Erstellen einer neuen Reprsentation in einem neuen D
37、ateiformat unter Zuhilfenahme eines Konvertierungsprogramms 3.11 Migration (Datentrger) beinhaltet das Kopieren einer Reprsentation auf einen anderen Datentrger 3.12 Produzent Person, Institution oder System, die/das dem digitalen Langzeitarchiv Reprsentationen von Informationsobjekten zum Zweck der
38、 Langzeiterhaltung bergibt ANMERKUNG Produzenten sind nicht notwendigerweise die Urheber, sondern knnen auch Lieferanten der Reprsentationen sein. 3.13 Repsentation logisch abgegrenzte Einheit digitaler Daten in einem informationstechnischen System, die ein Informationsobjekt reprsentiert 3.14 signi
39、fikante Eigenschaften Eigenschaften der fr die Archivierung vorgesehenen Reprsentationen, die fr den Erhalt der von ihnen reprsentierten Informationsobjekte im Hinblick auf die zuknftige Nutzung durch die Zielgruppen relevant sind ANMERKUNG ber lange Zeit knnen digital gespeicherte Informationen nur
40、 erhalten werden, wenn die Reprsen-tationen selbst oder ihre Umgebung verndert werden. Ziel ist es, die signifikanten Eigenschaften nicht zu verndern. Signifikante Eigenschaften sind daher auf der Ebene der Informationsobjekte zu beschreiben. 3.15 Transferpaket Paket, das vom Produzenten an das digi
41、tale Langzeitarchiv abgegeben wird ANMERKUNG 1 Die Inhaltsdaten knnen bereits durch Metadaten angereichert sein. ANMERKUNG 2 In Anlehnung an ISO 14721:2003 (en: Submission Information Package, SIP). 3.16 bernahme Organisation und Durchfhrung aller Prozesse, die zur Aufnahme eines Informationsobjekts
42、 ins Archiv und zur bernahme der Verantwortung durch das digitale Langzeitarchiv fhren 3.17 Zielgruppe identifizierbare Gruppe von potenziellen Nutzern mit bestimmten Interessen und Voraussetzungen ANMERKUNG Dies kann die Allgemeinheit sein sowie eine kleine Gruppe von Experten. 8 DIN 31645:2011-11
43、4 Objekte 4.1 Auswahl der zu archivierenden Informationen 4.1.1 Allgemeines Die Kriterien fr die Auswahl der Informationsobjekte, welche dauerhaft archiviert werden sollen, leiten sich aus dem Gesamtauftrag des digitalen Langzeitarchivs ab. Die notwendigen technischen Entscheidungen bei der Auswahl
44、muss das digitale Langzeitarchiv in Abstimmung mit dem Produzenten treffen. Hierbei geht es vor allem um die Auswahl und Vereinbarung von Datenformaten, welche fr die Langzeitarchivierung geeignet sind und die zur Darstellung der Reprsentationen im System des digitalen Langzeitarchivs bentigt werden
45、, sowie um die Auswahl der notwendigen Metadatenformate. In vielen Fllen sind die standardmig gebotenen Exportfunktionen der Produzentensysteme nicht in der Lage, die Reprsentationen in der vom digitalen Langzeitarchiv gewnschten Form zu exportieren. Der gesamte bernahmeprozess ist fr Produzent und
46、digitales Langzeitarchiv einfacher und kostengnstiger, wenn taugliche Exportfunktionen bzw. Archiv-schnittstellen bereits bei der Planung und Beschaffung von elektronischen Systemen bercksichtigt und implementiert werden. Das digitale Langzeitarchiv sollte daher frhzeitig vom Produzenten ber die Ans
47、chaf-fung eines neuen EDV-Systems informiert und in dessen Konzeption mit einbezogen werden. 4.1.2 Auswahl der Informationsobjekte Aus den beim Produzenten vorhandenen Informationen mssen die Informationsobjekte ausgewhlt werden, welche als Archivgut dauerhaft, authentisch und sicher bernommen werde
48、n sollen. Diese Auswahl erfolgt nach bestimmten Bewertungskriterien, die sich aus dem gesetzlichen oder vertraglich festgelegten Auftrag eines digitalen Langzeitarchivs ergeben. BEISPIEL 1 Ein Beispiel aus dem Archivwesen fr ein standardisiertes Vorgehen bei der Auswahl von Informations-objekten ist
49、 das DOMEA Aussonderungsmodul1, welches Wege zur geregelten Abgabe elektronischer Akten aus Behrdensystemen an die zustndigen ffentlichen Archive beschreibt und zwei Verfahren zur Anbietung und Auswahl der abzugebenden Akten kennt. Im ersten Verfahren (4-stufig) wird dem Archiv eine elektronische Anbieteliste bermittelt, auf der die in Frage kommenden Informationsobjekte (in diesem Fall elektronis