Les bases de données, ça s’archive comment?

La question se pose en effet de plus en plus dans les milieux archivistiques. En effet, les archivistes, des administrations publiques par exemple, sont confrontés à ce problème. Mais bien souvent, nous ne sommes pas du tout prêts à prendre en charge ce type de documents, à cause souvent de la méconnaissance des exigences archivistiques, techniques et matérielles nécessaires. Mais pas de panique, outils et techniques existent ou se développent en ce moment même!

Le projet européen Planets  qui s’est terminé le 31 mai 2010 a réuni un grand nombre de services d’archives et de bibliothèques nationaux dans le but d’élaborer des outils, informatiques ou théoriques, pour faciliter la préservation à long terme des objets numériques ainsi que leur diffusion.Les BDD n’ont pas été laissée de côté et dans ce cadre, les Archives fédérales suisses ont conçu une suite logicielle permettant l’archivage d’un certain type de BDD: les bases de données relationnelles. Les recherches suisses ont résultés sur ce produit : SIARD.  La BDD étant un objet numérique, son traitement archivistique est semblable aux autres documents numériques (audiovisuels par exemple). Le programme permet donc de construire des paquets d’informations au sens de la norme OAIS. Ce paquet d’information est constitué d’un header et d’un content. Le header contient les métadonnées. Le content rassemble le contenu du document, ici de la BDD qui est migrée au format « .siard », mais aussi la documentation inhérente à la BDD, comme un mode d’emploi en pdf par exemple.

Oui, mais au niveau de l’évaluation et de la prise en charge comment procède-t-on?
Tout le monde est d’accord, l’archivage des bases de données est très complexe et il est presque impossible de définir un cadre de traitement applicable à toutes les bases de données ou à certaines catégories. Chaque BDD doit donc être analysée  et évaluée individuellement. En effet, la structure de la BDD, le modèle de la BDD, les relations existentes entre les données ou encore avec d’autres systèmes de gestion sont uniques. N’ayons toutefois pas peur, il n’est pas toujours nécessaire d’archiver une BDD, surtout si elle est à la base de la production de documents comme dans un système de gestion de contenu (CMS). Dans ces cas, ce ne sont plus les données qui caractérisent l’objet d’information à archiver, mais les documents finis.

La prise en charge d’une BDD tout comme n’importe quel autre objet numérique, devrait se faire dans un environnement OAIS.

Mais pour  l’archivage d’une BDD voici quelques conseils génériques que je dégage de mes recherches actuelles dans le cadre de mon Travail de Bachelor:

  1. Récolte d’informations: auprès des collaborateurs et des autres acteurs ayant affaire avec la BDD comme les informaticiens de votre institution, l’entreprise ayant conçu le système.
  2. Analyse de la BDD: analyse approfondie de la BDD, de son contenu, de sa fonction, de son fonctionnement, de son environnement technique, de son modèle de relation, des processus de travail liés. La BDD ne doit plus avoir de secrets pour vous.
  3. Evaluation archivistique: sur la base des informations récoltées, procéder à une évaluation archivistique des éléments importants à archiver. Une BDD a l’immense avantage de permettre une sélection informatique de certains champs à archiver. Lors de la sélection, attention aux relations entre les données. Une mauvaise manipulation peut entraîner une perte d’informations importante! De plus, il est également conseillé d’archiver quelques champs de toutes les entrées de la base et non tous les champs de quelques entrées représentatives, pratique qui s’apparenterait à un échantillonnage.
  4. Définition des données à archiver et des métadonnées fabriquées par la BDD elle-même
  5. Test d’archivage: étape décisive permettant de confirmer ou d’infirmer les décisions prises précédemment. Evaluation et ajustements.
  6. Migration vers SIARD (par exemple):  on parle de migration dans ce cas, car les données seront enregistrées dans un nouveau format (.siard). Un contrôle sur la fiabilité de la migration doit être effectué, grâce à des outils informatiques tels qu’un Checksum ou sommes de contrôle.
  7. Compléter les métadonnées: les métadonnées sont extrêmement importantes, car elles sont le seul rempart contre la perte d’informations, l’incompréhensibilité qui met directement en péril l’intégrité puis l’authenticité de la BDD et qui la rend non transmissible. Il faut donc documenter, documenter, documenter.
  8. Gestion du paquet d’informations et diffusion: le paquet contenant les métadonnées et les données de la BDD, doit ensuite être géré dans un système de gestion approprié garantissant l’accès au fichier à toute personne autorisée en tout temps.
Cette procédure n’a aucune prétention d’exhaustivité, mais elle présente les bases de la prise en charge. Ces quelques étapes nous montrent que le travail a mener est considérable. C’est pourquoi il faut d’abord se demander s’il est nécessaire d’archiver une BDD avant d’entreprendre quoi que ce soit ou d’engager les ressources nécessaires.
Prochainement, des articles plus détaillés sur le sujet.
Publicités

Un commentaire Ajoutez le vôtre

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s