Archivage et stockage pérennes des ressources numériques

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '2:a50cc5e7e8e0607f8b9d788ae3e4c17f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '2:57f615cce898ee007dfe959fbad60690' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.

Tout patrimoine numérique nécessite un archivage des documents et des métadonnées. Par construction, ORI-OAI répond aux besoins des politiques d'archivage des établissements : l'outil permet de rassembler et de stocker toutes les ressources internes ou externes à l'établissement dans des entrepôts OAI et des serveurs clairement identifiés. L'archivage en est donc grandement facilité.

Sur cette question, cf. également les chapitres 2 et 3 de Corinne Leblond (dir.), Archivage et stockage pérennes : enjeux et réalisations, Lavoisier, Paris, 2009.

ORI-OAI, un outil pour l'archivage numérique

ORI-OAI a été conçu pour créer des métadonnées de qualité et les partager.

Archivage des métadonnées

Dès lors que ces métadonnées sont créées, elles sont stockées dans une base de données XML et accessibles par le protocole OAI-PMH : il s'agit d'un entrepôt OAI. Cet entrepôt constitue non seulement une archive ouverte accessible par les chercheurs et tous les autres utilisateurs, mais également une archive au sens classique du terme.

Plus précisément, l'entrepôt OAI devient un système de gestion de l'archive dès lors qu'il est intégré dans le processus et la politique d'archivage. En particulier, ORI-OAI permet de créer des alertes selon un référentiel de conservation intégré au circuit de traitement et d'indexation.

En pratique, ORI-OAI permet de gérer des ressources qui ne sont plus modifiées, par exemple des thèses, et des ressources qui évoluent, par exemple les cours dont une nouvelle version est en principe éditée chaque année.

Archivage des documents

ORI-OAI peut archiver des métadonnées sans les ressources numériques associées, ce qui est utile notamment lorsque les documents sont externes et que l'établissement ne possède pas les droits nécessaires pour en faire des copies, ou lorsque les ressources numériques ne sont pas seulement des fichiers, mais par exemple des applications pédagogiques multimédias.

Quoi qu'il en soit, dans le cadre de la gestion de sa production éditoriale, un établissement a tout intérêt à archiver ses documents en même temps que ses métadonnées, surtout pour ne pas perdre les liens entre eux.

En pratique, l'outil de workflow intégré à ORI-OAI peut être configuré pour initier des actions telle que la copie de fichiers sur un ou plusieurs serveurs. En fait, le processus est le même que pour la publication des ressources sur un intranet ou sur un serveur web : il s'agit simplement d'indiquer les informations du ou des serveurs d'archivage.

Ces serveurs peuvent être de deux types :

  • serveur classique, c'est-à-dire un répertoire sur un ordinateur sous Linux ou Windows ;
  • serveur de GED (gestion électronique des documents) à la norme CMIS.

Un serveur classique suffit pour archiver les documents, mais un serveur de GED apporte quelques fonctionnalités supplémentaires, principalement la gestion plus simple des ressources numériques comprenant plusieurs versions ou plusieurs fichiers et la gestion fine et dynamique des droits d'accès.

Un outil de GED est disponible par défaut dans ORI-OAI : il s'agit de Nuxeo, également utilisé dans le portail libre ESUP-ECM. La version 2.1 intégrera également par défaut OpenCMIS, une solution plus légère.

Par ailleurs, les documents peuvent être archivés sous différents formats pour répondre aux différents usages (format natif et PDF normalisé pour l'archivage pérenne, pages html et PDF complet pour la publication des archives ouvertes...).

Liaison avec le Centre informatique national de l'enseignement supérieur (CINES)

Les métadonnées et les documents peuvent être archivés localement, sur les serveurs de l'établissement, mais également sur des serveurs externes et en particulier sur ceux du CINES. Des réflexions sont d'ailleurs en cours pour connecter ORI-OAI et le CINES, officiellement chargé de l'archivage définitif de tous les établissements de l'enseignement supérieur français.

Si les thèses envoyées sur STAR via ORI-OAI sont déjà archivées indirectement au CINES, tous les autres documents peuvent aussi faire l'objet d'un dépôt, direct ou indirect.

Un outil garant de la pérennité de l'archivage numérique

La mise en place d'un outil tel qu'ORI-OAI est de facto une garantie de pérennité des archives numériques, car il s'inscrit le plus souvent, mais pas nécessairement, dans une démarche de projet. En outre, l'outil se base systématiquement sur des choix normatifs et techniques durables.

ORI-OAI comme projet institutionnel

La pérennité d'une archive institutionnelle est liée avant tout à sa prise en compte dans le projet politique et stratégique de l'établissement et dans les réseaux nationaux et internationaux de valorisation des productions scientifiques et pédagogiques. Or comme ORI-OAI répond justement à ce type de projet, la pérennité des ressources référencées par ORI-OAI est assurée de facto.

Concrètement, ORI-OAI peut être utilisé par un grand nombre d'acteurs de l'établissement : les enseignants, les chercheurs, les étudiants, les documentalistes, les agents administratifs... qui sont tous amenés à publier et à rechercher des ressources numériques. Or plus les usagers des ressources numériques sont nombreux et plus les ressouces sont nombreuses, plus les connaissances sont capitalisées et plus l'archive institutionnelle devient pérenne.

Il en est de même lorsque l'établissement s'insère dans des réseaux tels que les universités numériques et les regroupements. Dans ce cas, l'archive commune peut même devenir l'un des points centraux de la coopération.

Bref, plus la dynamique de constitution d'une archive est grande, plus le patrimoine numérique devient durable.

Des choix normatifs et techniques durables

Même s'il est possible d'utiliser des règles spécifiques à un établissement, ORI-OAI s'appuie par défaut sur des jeux de métadonnées ayant une portée nationale ou internationale : Dublin Core, LOM, TEF, AO-Fr... D'autres normes ou standards internationaux sont également utilisées : XML pour le langage de description, OAI-PMH pour les échanges de notices, Shibboleth pour l'identification... Ces choix sont garants non seulement de la durabilité, mais également de l'interopérabilité, de la facilité de maintenance et de qualité des données.

Sur le plan technique, l'architecture modulaire et le fait que chaque module soit conçu autour de composants libres, ouverts et répandus (Java, Apache Lucene...), garantissent l'évolutivité et la pérennité de l'outil : les modules peuvent évoluer à des rythmes différents et la technologie d'un module peut être changée sans remettre en cause l'outil.

Ces choix se traduisent notamment dans la possibilité de disposer d'un identifiant unique et d'une url pérenne pour chaque ressource numérique, ce qui facilite la recherche et la réexploitation à long terme des métadonnées et des documents.

Enfin, la dynamique autour d'ORI-OAI est forte : plus les établissements utilisateurs d'ORI-OAI sont nombreux, plus l'outil a un grand avenir.