Conservazione Digitale

Centro di Eccellenza Italiano sulla Conservazione Digitale

Metadati per la conservazione

Una delle questioni più dibattute nella comunità internazionale che si occupa di conservazione digitale riguarda il nodo specifico dei metadati con particolare riferimento alla identificazione delle strutture e degli schemi logici di elementi informativi corrispondenti alle risorse digitali che si intendono salvaguardare e alle attività e funzioni di sistema di cui è necessario tenere traccia storica nel lungo periodo (informazioni descrittive della risorsa e del contesto di provenienza, metadati di natura gestionale sui veri e propri processi conservativi).

Per metadati per la conservazione si intendono in particolare quelle informazioni che un deposito digitale utilizza per assicurare il processo di conservazione digitale, ovvero le informazioni necessarie a garantire la possibilità della tenuta, l’accessibilità, l’intelligibilità, l’autenticità delle risorse digitali.

Il tema della categorizzazione dei metadati per la conservazione ha suscitato e suscita ancora notevoli discussioni e ha dato vita a numerosi tentativi non sempre coerenti e rigorosi dal punto di vista dell’analisi concettuale. Da un lato l’insieme dei metadati sviluppati come standard dalle diverse comunità professionali sono considerati insufficienti, dall’altro la loro concreta e quotidiana applicazione si rivela alquanto impegnativa. Accanto ai numerosi tentativi di produrre insiemi standard di metadati finalizzati alla conservazione digitale, sono quindi cresciuti gli sforzi – peraltro non ancora coronati da successi incontrovertibili – finalizzati a sviluppare metodi e strumenti per l’acquisizione automatica dei metadati medesimi, o almeno di una parte significativa.

Una prima conclusione, comune a quasi tutti i progetti di ricerca sviluppati nell’ultimo decennio, ritiene comunque indispensabile, oltre a definire concretamente gli elementi specifici, disporre di un adeguato modello architetturale, coerente con quello proposto proprio a fini conservativi dallo standard ISO 14721 OAIS. In particolare, il modello OAIS stabilisce che le informazioni di riferimento ai documenti debbano essere organizzate per componenti funzionali, distinguendo e individuando almeno quattro categorie di metadati finalizzate ad assicurare l’integrità delle unità documentarie singole e delle collezioni, delle relazioni di contesto e delle informazioni per l’accesso, ma anche il mantenimento nel lungo periodo in forme stabili delle modalità originarie di reperimento dei documenti e della loro accessibilità, cioè della capacità di comprensione e di elaborazione degli oggetti informatici da parte delle macchine e degli esseri umani:

  1. reference information: informazioni identificative del contenuto (ad esempio nel caso degli archivi la segnatura),
  2. context information: informazioni di contesto che documentano le relazioni tra il contenuto e l’ambiente di produzione,
  3. provenance information: informazioni di provenienza che documentano la storia del contenuto e le trasformazioni subite (ad esempio la formazione, la catena della custodia, le attività di conservazione e le loro conseguenze),
  4. fixity information: informazioni di validazione che documentano i meccanismi che garantiscano l’integrità delle informazioni (firma digitale, checksum).

Su tale modello ora descritto si sono basate (anche se spesso semplificando notevolmente la struttura originaria delle componenti informative e le funzionalità) le applicazioni finora sviluppate nella costruzione di depositi per la conservazione digitale, e soprattutto su tale base hanno lavorato i principali progetti di ricerca internazionali con l’obiettivo di definire schemi e procedure condivise, tra cui l’Online Computer Library Center/Research Libraries Group (OCLC/RLG) Metadata Framework (2002). Approfondimenti successivi sono stati affrontati a partire dal 2003, sempre per iniziativa di OCLC e RLG nell’ambito del progetto internazionale Premis. Preservation Metadata Implementation Strategies, con l’obiettivo di sviluppare un insieme di elementi cruciali e facilmente implementabili per la conservazione degli oggetti digitali e, più in generale, di sistemi documentari digitali.

Per un approfondimento su PREMIS si rimanda direttamente alla specifica pagina di approfondimento PREMIS – Data Dictionnary for Preservation Metadata.

Oltre allo standard PREMIS, unanimemente riconosciuto come il riferimento principale per i metadati per al conservazione, anche altri standard sono rilevanti anche se sviluppati in altri settori.

  • ISO 23081-1/3:2011 – Metadata for records, un gruppo di standard ISO relativi ai metadati per la gestione documentale che ha elaborato un modello generale di metadati articolati in categorie funzionali alla gestione dei documenti (metadati documentari, metadati relativi a policy, metadati sui soggetti produttori, sui processi di lavoro e sui processi di gestione dei documenti)
  • NLZ – National Library of New Zealand – Metadata Implementation Schema, una proposta abbastanza completa sviluppato dalla National Library of New Zealand per gestire al conservazione delle sue collezioni.

Merita inoltre una analisi approfondita anche la riflessione condotta in materia dai ricercatori di InterPARES nelle diverse fasi del progetto in particolare:

Quest’ultimo documento rispecchia soprattutto la teoria australiana del record continuum e il modello sviluppato ulteriormente nell’ambito del progetto ADRI.

Conservazione Digitale © 2014