Compte rendu des Journées européennes sur les DTD EAD et EAC, 7-8 octobre 2004
Deux ans après la tenue, dans le grand auditorium de la Bibliothèque nationale de France, d’une journée d’étude sur l’EAD (Description archivistique encodée) et ses applications patrimoniales dans les archives et les bibliothèques, la direction des Archives de France organisait, les 7 et 8 octobre 2004, à Paris, au Musée national des Arts et Traditions populaires, des journées européennes sur les outils informatiques permettant de structurer en XML (Extensible Markup Language) les instruments de recherche décrivant des documents d’archives et les données d’autorité. La première conférence européenne des utilisateurs réels ou potentiels de l’EAD s’était tenue au Public Record Office à Kew, en octobre 1999.
L’EAD, dont la première version officielle de 1998 a été révisée en 2002, est une définition de type de document (DTD) fondée sur le même principe de description à plusieurs niveaux que la norme internationale et générale de description archivistique ISAD(G). Elle a été influencée par la DTD TEI (Text Encoding Initiative) et elle contient des éléments comparables à certaines zones du format MARC (un inventaire EAD peut être relié avec une notice en format MARC, et inversement, un document XML/EAD peut être restitué en MARC).
L’EAD est à présent parfaitement établie en Amérique du Nord et dans le reste du monde, et elle a atteint sa maturité technique tout en continuant d’évoluer pour prendre en compte les transformations technologiques.
Parallèlement, depuis 2001, une autre DTD, l’EAC (Contexte archivistique encodé), est en cours de développement. Parfaitement compatible avec la norme internationale sur les notices d’autorité (collectivités, personnes, familles) ISAAR(CPF), complémentaire du format UNIMARC/Autorités, l’EAC est une combinaison des notices d’autorité bibliographiques et des notices d’autorité archivistiques, qui donnent des informations sur le producteur et le contexte de production des documents.
Ces journées, qui rassemblaient les meilleurs spécialistes internationaux, européens et français, ont rencontré un vif succès : plus de 280 participants, archivistes, bibliothécaires, conservateurs de musées, consultants en informatique, représentaient 17 pays. Les trois séances plénières consacrées à l’EAD traitèrent successivement des impératifs pour la mise en œuvre de la DTD (normalisation de la description, formation des professionnels), de la production d’inventaires et de catalogues en EAD/XML, et enfin des outils de publication et de diffusion. La quatrième et dernière demi-journée portait sur l’EAC : origine, caractéristiques principales, liens avec ISAAR(CPF), exemples d’applications. Des stands de démonstration vinrent compléter les débats.
Les enseignements à tirer de ces deux journées sont multiples.
Dans les projets de conversion rétrospective, le recours à un prestataire extérieur n’évite pas la formation du personnel à l’ISAD(G) et à l’EAD et la création en interne d’un groupe de travail chargé d’établir des spécifications, avec des conséquences sur les méthodes de travail futures (Archives départementales des Pyrénées-Atlantiques). Malgré les difficultés inhérentes à la diversité des fonds et collections décrits et des méthodes de description, l’encodage rétrospectif ouvre la voie à de nombreuses coopérations pour des projets basés sur l’EAD (Bodleian Library). Le choix de l’EAD vise non seulement la structuration des notices existantes, de nature diverse, de niveaux de description différents, mais aussi la production de catalogues vivants, mis en ligne au fur et à mesure de leur développement (Bibliothèque nationale de France/Département des manuscrits).
De la table ronde sur la formation des professionnels, on retiendra la diversité des institutions où l’enseignement est dispensé et la variété des contenus pédagogiques. L’appropriation technique pose moins problème que l’absence de normalisation des pratiques de description.
Des solutions très différentes ont été adoptées pour la production de documents en EAD : expériences de saisie directe avec des éditeurs XML ou des outils élaborés pour la rédaction d’inventaires (logiciel MidosaXML conçu par l’Archivschule de Marburg) ou récupérations automatiques de données (base BASYS-S du Bundesarchiv, base des permis de construire de la mairie de Paris), ces exports pouvant quelquefois nécessiter des ajustements (projet Metrica Regni des Archives historiques de Varsovie). Des approches originales ont également été retenues : adaptation de l’EAD (application, en Suisse, d’une version simplifiée de l’EAD ; module Aide au classement du logiciel Arkhéia utilisé dans de nombreux services d’archives territoriaux français), voire mise en œuvre de DTD spécifiques (Encoded Archival Guide pour la description des services d’archives dans le cadre d’un portail répertoriant plus de 42 000 services d’archives espagnols et hispanophones d’Amérique latine). Par ailleurs, des outils de validation destinés à assurer une meilleure qualité des documents EAD ont été récemment développés (sociétés Anaphore et AJLSM).
La réalisation d’outils de consultation des documents EAD est indispensable à la chaîne de production et de diffusion des instruments de recherche encodés. Des solutions libres et propriétaires coexistent : propriétaires, avec le logiciel Action archives utilisé aux Archives départementales de la Côte-d’Or, et libres, avec les logiciels PLEADE et Navimages et la mise en place d’outils permettant la récupération à partir de notices EAD de métadonnées en Dublin Core pour faciliter l’intégration des documents EAD dans des bases de données plus larges. Quant aux trois types d’applications présentés pour le Royaume-Uni (Access to archives, conduit par les Archives nationales, ArchivesHub, portail sur les archives des universités et des établissements d’enseignement supérieur, et NAHSTE, portail sur les fonds scientifiques conservés en Écosse), ils ont montré que si les objectifs généraux étaient semblables, les projets utilisant l’EAD étaient aussi le reflet de différents environnements institutionnels et qu’ils correspondaient aux différents besoins des services et des utilisateurs.
Parmi les évolutions attendues de l’EAD, il convient de noter sa transformation en schéma XML. La DTD EAD a été écrite pour la structuration d’un document à structure narrative. Elle est moins adaptée pour la description en notices courantes, indépendantes les unes des autres. L’utilisation d’un schéma XML est plus conforme à une approche centrée sur le document et plus propice à la description courante des pièces. L’un des objectifs majeurs du schéma XML sera l’interopérabilité de l’EAD avec d’autres schémas : cela recoupe l’utilisation d’autres schémas dans l’EAD et l’utilisation de l’EAD dans d’autres schémas.
La description du contexte de production des archives et des autres sources primaires est fondamentale. Décrire des archives implique en effet de fournir des informations sur l’histoire de leur conservation, leur mode de classement ou les circonstances entourant leur production et leur utilisation. L’appropriation par la France de l’EAC commence par la traduction, par le groupe “ données d’autorité ” de l’AFNOR (CG46/CN357/GE4), du dictionnaire des éléments de l’EAC.
SiAsfi, le guide Internet des Archives d’État de Florence, constitue un exemple intéressant de mise en œuvre de la norme ISAAR (le passage à l’EAC se fera dans une seconde étape) : la description séparée mais liée des archives, de leurs producteurs et du contexte historico-institutionnel de production des documents permet une plus grande souplesse d’utilisation et de mise à jour des données.
Le projet européen LEAF (“ Relier et Explorer les Fichiers d’Autorité ”) vise à structurer en XML les notices d’autorité fournies par les différents partenaires. Initialement, le projet devait traiter les données d’autorité de personnes physiques et de collectivités. Devant la complexité des autorités collectivités, le champ d’action a été restreint aux personnes physiques, du moins pour la première phase. L’EAC a été choisie comme format fédérateur pour encoder les différentes notices d’autorité hétérogènes. Les tests ont permis de faire évoluer l’EAC à partir des réflexions des partenaires de LEAF.
En France, le développement rapide de l’EAD et ensuite de l’EAC se fera par l’intégration de ces normes dans les logiciels utilisés par les services d’archives pour informatiser la description archivistique. Le fait que les outils de production directe de documents XML/EAD soient encore difficiles à appréhender peut en effet constituer un obstacle au développement de l’EAD dans le réseau. Par ailleurs, produire des documents EAD avec des éditeurs XML nécessite la mise en place d’une plate-forme de gestion des documents XML, pour pallier les problèmes de version, d’accès, de sauvegarde et de contrôle de documents EAD. La nécessité de sensibiliser, au sein de nos services, un personnel hétérogène, aux qualifications très diverses, peut constituer une autre difficulté.
Aussi la direction des Archives de France encourage-t-elle l’intégration par les outils existants (logiciels d’archives) des normes (mais toutes les potentialités de l’EAD ne pourront peut-être pas y être intégrées). Une étude vient d’être lancée sur les fonctionnalités de description documentaire offertes par ces logiciels au regard des normes ISAD(G) et ISAAR(CPF) et de la DTD EAD.
Une autre spécificité française est le développement de solutions originales, libres ou propriétaires, pour la publication des documents encodés sur le Web. Il serait illusoire de penser qu’un outil unique peut tout faire, depuis la conception de l’instrument de recherche jusqu’à sa publication sur Internet, au risque d’aboutir à des solutions propriétaires. Il est par contre indispensable de réfléchir à des solutions visant à la compatibilité des différents outils de production et de diffusion des instruments de recherche entre eux, ainsi qu’à leurs mises à jour, tant il est vrai qu’aucun instrument de recherche ne peut être considéré comme définitif.
Enfin, au-delà de la description des documents, on commence à envisager l’intégration d’objets numériques au sein de documents XML. La conversion en EAD de la base des permis de construire de la mairie de Paris constitue une première puisqu’elle consiste à décrire et à archiver des objets numériques. D’autres expériences sont en cours, visant à utiliser, dans le cadre de la dématérialisation de certaines procédures administratives (contrôle de légalité), le schéma METS (Metatata Encoding and Transmission Standard), schéma XML qui sert à encoder les métadonnées descriptives, administratives et structurelles d’objets numériques et qui englobe l’EAD.
Les actes complets des journées européennes des 7 et 8 octobre 2004 paraîtront dans le Journal of Archival Organization, revue américaine spécialisée dans les outils électroniques appliqués à la description archivistique (courant premier semestre 2005).
Rapporteur:
Claire Sibille, Direction des Archives de France
claire.sibille [at] culture [dot] gouv [dot] fr
Pour plus d'informations : www.ica.org/eurbica