Conservazione Digitale

Centro di Eccellenza Italiano sulla Conservazione Digitale

OAIS Reference Model

L’Open Archival Information System (recepito poi come standard ISO 14721:2005/2014) è stato elaborato dal Consultative Committee for Space Data Systems – CCSDS  e  pubblicato nel 2002 come modello di riferimento in grado di fornire concetti fondamentali per la conservazione digitale e definizioni essenziali finalizzate a dare stabilità e coerenza anche terminologica alla funzione conservativa di oggetti digitali di qualunque natura. Lo standard è stato poi aggiornato, sia da CCSDS che da ISO nel 2014. È oggi considerato lo standard de facto per lo sviluppo di archivi e depositi digitali, soprattutto perché il modello non fa riferimento ad un’architettura specifica, ma si limita a definire le funzionalità richieste, che le implementazioni effettive possono raggruppare o suddividere in modi diversi. Inoltre, OAIS non si occupa di costi e di sostenibilità del modello conservativo né di disegno applicativo di un sistema di conservazione, ma si basa su una sequenza logica di principi e concetti, sviluppati ed esposti in modo che:

  • la terminologia utilizzata sia applicabile in contesti diversificati e ampi;
  • la conformità allo standard sia definita anche se non nel dettaglio;
  • qualunque tipologia di informazione digitale possa essere considerata.

È proprio questo approccio molto generale a conferire allo standard il suo ruolo di riferimento condiviso ed a garantirgli un più ampio orizzonte di validità e di durata nel tempo.

OAIS-1

Il modello si basa su alcuni concetti semplici, e spesso intuitivi, e definisce chiaramente il ruolo degli attori esterni, i Produttori e i Consumatori, che insieme costituiscono la Comunità Designata, cioè l’insieme di soggetti che interessati e destinatari del processo di conservazione, e le relazioni di questi con il Management  che gestisce il sistema di conservazione, che è poi l’OAIS. Al centro dell’architettura OAIS è la gestione di pacchetti informativi basati su informazioni sulla rappresentazione (Representation Information – RepInfo) annidate e correlate alle esigenze di una comunità di riferimento, la Designated Community di cui abbiamo parlato sopra e che costituisce una sorta di target group utilizzato come riferimento per l’intelligibilità e la verificabilità dei processi conservativi.OAIS-6

Questa visione della struttura dei pacchetti informativi, che è uno dei contributi fondamentali di OAIS, corrisponde poi al concetto, ad un tempo elementare ed universale, che ogni oggetto digitale, per avere un significato, debba contenere al suo interno due componenti: il Data Object, e cioè la sequenza di bit (bitstream), che di per sé non significa nulla, e la Representation Information, che specifica le modalità di codifica dell’informazione binaria e ne fornisce quindi l’indispensabile chiave di decodifica e quindi di lettura e di interpretazione.

OAIS-3

I pacchetti informativi previsti dal modello si riferiscono alle modalità di collegare i contenuti informativi  e le informazioni rilevanti per la conservazione. Si distinguono in base alle diverse fasi di gestione del processo conservativo:

  • Submission Information Package (SIP), che viene trasmesso nella fase di versamento dal produttore al deposito;
  • Archival Information Package (AIP), che viene generato a partire dal SIP in fase di accettazione (Ingestion) e poi diventa oggetto diretto della conservazione deposito;
  • Dissemination Information Package (DIP), che viene generato a partire dall’AIP per essere distribuito alla Comunità Designata per la fruizione.

Un aspetto centrale del modello è costituito dalle cosiddette informazioni sulla conservazione (Preservation Description Information – PDI), ovvero sulla quantità e qualità di informazioni che identificano e descrivono gli oggetti informativi da conservare con particolare attenzione per i ‘metadati’ relativi alla identificazione degli oggetti (reference), alla loro origine (provenance), al contesto (context) e alla loro integrità (fixity).

In particolare,

  • le informazioni di reference individuano univocamente e possibilmente in modo persistente gli oggetti digitali (contenuti informativi, RepInfo, ecc.) e, se necessario, descrivono uno o più meccanismi di attribuzione di identificatori; possono consentire a sistemi esterni di riferirsi in maniera non ambigua al contenuto informativo (ad esempio un codice ISBN o un codice DOI);
  • le informazioni di provenance documentano la storia del contenuto informativo e comprendono origine o fonte, cambiamenti avvenuti, storia e responsabilità della custodia; il deposito è responsabile per la creazione e conservazione delle informazioni sulla provenienza a partire dal versamento, ma tali informazioni devono essere fornite già nella fase di formazione da parte del soggetto produttore dei contenuti (producer);
  • le informazioni di context documentano le relazioni del contenuto informativo con l’ambiente di riferimento (originario o di ri-uso), ivi incluse le modalità di formazione e le forme in cui si definiscono le relazioni con altri contenuti esistenti anche in sistemi diversi;
  • le informazioni di fixity documentano i meccanismi di autenticazione e forniscono le chiavi di validazione utilizzate per evitare alterazioni non documentate;  gli algoritmi utilizzati (checksum, hash, object digest) possono essere di varia natura (SHA, CRC-32, ecc.)  e diversamente sicuri, ma in ogni caso vulnerabili, sia pure in diversa misura; si tratta inoltre di informazioni indipendenti dai domini disciplinari cui appartengono i contenuti informativi, a differenza delle altre categorie di PDI;
  • le informazioni sui diritti di accesso, introdotte come nuova categoria nell’ultima versione dello standard approvata nel 2012, identificano i limiti di accesso al contenuto informativo, inclusi i termini di licenza, le restrizioni legali e i sistemi di controllo; Includono le condizioni di accesso e disseminazione previste nell’accordo di versamento in relazione sia alla conservazione da parte del deposito OAIS sia all’uso da parte degli utenti finali oltre alle specifiche per l’applicazione di misure gestionali in questo ambito.

Riguardo alle implementazioni di OAIS, la conformità al modello è spesso dichiarata dai depositi, ma non è sempre facilmente verificabile anche in considerazione del fatto che lo standard non prevede strumenti di certificazione, ma solo un elenco di compiti obbligatori. E’ per questa ragione che le comunità scientifiche e di pratiche che si occupano di conservazione hanno sviluppato raccomandazioni e standard di supporto (TRAC, ISO 16363 e ISO 16919), al fine di specificare e di formalizzare adeguatamente i criteri e el procedure di valutazione e di certificazione.

Per un ulteriore approfondimento si rimanda ai moduli didattici:

Per lo standard si consiglia di scaricare direttamente la versione CCSDS del 2014:

  • CSDS 652.1-M-2 – Requirements for Bodies Providing Audit and Certification of Candidate Trustworthy Digital Repositories . Magenta Book. Issue 2. (2014).

gratuita ed in tutto identica alla versione ISO a pagamento.

Conservazione Digitale © 2014