Open Archives Initiative OAI, un projet fédérateur

By 18 March 2013

Des projets fédérateurs – Chapitre 2.

Nous appelons projet fédérateur les initiatives regroupant différents projets d’archives ouvertes sur base de critères définis mais qui peuvent être très englobant. Ces projets peuvent encourager la création de dépôts en ligne, envisager des mesures pour améliorer leur interopérabilité, mener des actions d’information, proposer des répertoires,… bref, autant de bonnes raisons pour se proposer comme point d’accès (ou de recherche) à différents dépôts ou revues en ligne d’accès plus ou moins ouvert.

Un intérêt plus important sera porté sur l’élaboration de méta­ données qui rendent interopérables les différents dépôts. Ces méta­données permettent la création de services ajoutés dont un des plus importants est sans conteste la recherche d’information. Ceci permet au chercheur d’effectuer une seule fois sa requête pour obtenir les documents provenants de plusieurs dépôts. Les dépôts institutionnels ont également un grand intérêt pour ce type de services. Etant le plus souvent multidisciplinaires, la recherche transversale leurs permet de faire connaître leur production à un public plus large. En effet, le chercheur, s’il doit soumettre sa requête à tous les dépôts institutionnels préférera se tourner vers un dépôt thématique tel que arXiv s’il est physicien ou RePEc s’il est économiste.

Nous abordons, dans la suite de ce chapitre, trois projets fédérateurs connus et souvent rencontrés dans l’analyse des différents modèles. Il s’agit de l’Open Archives Initiatives (OAI), la Scholarly Publishing and Academic Resources Coalition (SPARC) et la Networked Digital Library of Theses and Dissertations (NDLTD). Il existe des projets plus spécifiques et d’ampleur plus restreinte, l’Open Archives Forum, quatrième et dernier fédérateur analysé, en est un bon exemple. Chacun des projets présentés sera entrevu sous différents aspects : ses objectifs, son historique et ses réalisations, qu’elles soient techniques ou autres.

Citons également le Directory of Open Access Journals (DOAJ) qui concentre en un point, l’accès à 1.219 périodiques d’accès ouvert. Pour 319 d’entre eux, il est possible d’en rechercher les articles [http://www.doaj.org]. L’Initiative de Budapest pour l’Accè s Ouvert (BOAI) est également une preuve de la mobilisation autour de l’accès ouvert. Parrainée par l’Open Society Institute (financée par George Soros), l’initiative de Budapest est à la fois une déclaration de principe, de stratégie et de soutien financier ayant pour but d’appuyer l’accès libre à l’information scientifique [http://www.soros.org/openaccess/fr/index.shtml]. Enfin, citons encore le Washington DC Principles for free access to science qui encourage les éditeurs not­for­profit à travailler avec le monde scientifique et universitaire. Cette initiative est liée à HighWire qui est cité comme exemple et qui abrite la plupart des signataires des principes de Washington [http://www.dcprinciples.org/ ; http://www.dcprinciples.org/statement.pdf].

1. OAI : Open Archives Initiative
<http://www.openarchives.org>

L’Open Archives Initiative a pour objectif le développement et la promotion de standards d’interopérabilité visant à faciliter la diffusion de contenus. Au départ, l’OAI trouve ses origines dans la volonté d’améliorer l’accès aux dépôts d’e­prints pour augmenter la disponibilité des textes issus de la communication scientifique [http://www.openarchives.org/documents/FAQ.html].

L’augmentation des dépôts et bibliothèques numériques a eu pour conséquence que les chercheurs devaient consulter séparément les différentes sources d’information et effectuer plusieurs fois leurs requêtes. Une certaine uniformisation des différentes initiatives et l’augmentation de leur interconnectivité étaient indispensables pour la réalisation de recherches transversales. D’autant plus que ces dépôts utilisent des bases de données qui ne sont pas accessibles aux moteurs de recherche généraux; elles font partie de ce qui est appelé le deep web ou web caché [Suleman 2001, p. 126].

L’OAI et les résultats auxquels elle a abouti sont basés sur les travaux d’Herbert Van de Sompel, des chercheurs et des bibliothécaires du laboratoire national de Los Alamos avec qui il a travaillé. En 1999, lors de la rencontre de Santa Fe, les problèmes générés par l’augmentation des dépôts d’e­prints ont été abordés. Les conclusions tirées de cette rencontre insistent sur la nécessité de développer des services pour permettre la recherche à travers les multiples dépôts, ainsi que sur l’intérêt de la copie de documents d’un dépôt vers un autre. Avec la coexistence des dépôts thématiques et institutionnels, un texte peut être disponible dans l’un et l’autre à condition que son auteur le dépose deux fois (ou plus). Si la copie peut se faire automatiquement, un seul dépôt suffit. Le texte intitulé Santa Fe Convention reprend le travail effectué. Au coeur de celui­ci se trouve la définition d’une interface permettant aux serveurs d’e­prints de rendre public les métadonnées des documents qu’ils abritent. Ces métadonnées peuvent ensuite être utilisées par les services de recherche fédérateurs ou par d’autres dépôts désirant identifier les documents pour les copier ensuite [Lynch 2001].

Tout au long de l’année 2000, la réflexion sur l’OAI et le travail sur l’interface de Santa Fe se sont poursuivies en prenant en compte d’autres acteurs confrontés aux mêmes problématiques : les bibliothèques, musées, éditeurs commerciaux de revues, membres de la communauté scientifique. L’OAI est, durant cette période, financée par la Coaliton for Networked Information et la Digital Library Federation et accueillie à l’université de Cornell. En janvier 2001, les spécifications établies lors de la convention de Santa Fe et revues en 2000 lors de différents ateliers sont rendues publiques. Elles forment ce qui est maintenant appelé l’Open Archives Metadata Harvesting Protocol ou OAI­PMH pour Open Archives Initiative Protocol for Metadata Harvesting [Lynch 2001].

L’OAI­PMH fonctionne comme une interface entre producteurs de données et producteurs de services. Le producteur de données maintient un (ou plusieurs) serveur supportant le protocole comme moyen d’expression des méta­données. Le producteur de service utilise ces méta­données comme base d’un service (par exemple : la recherche transversale d’information). Ces deux rôles ne sont pas mutuellement exclusifs, un producteur de données peut aussi offrir des services, et inversément [http://www.openarchives.org/documents/FAQ.html].

Le plus petit point commun de ces serveurs est l’utilisation des métadonnées telles que définies par le Dublin Core dans sa version “unqualified” ou simple3. Les responsables de dépôt sont libres de fournir des métadonnées plus complètes, elles ne seront cependant peut­être pas utilisées par les services basés sur l’OAI­PMH. La “communauté e­prints” travaille d’ailleurs sur la définition de méta­données plus adaptées à la description de ce type de document.

3 Le Dublin Core Metadata Initiative est une organisation dédiée à la promotion et l’adoption de standards de métadonnées interopérables, ainsi qu’au développement d’un vocabulaire de méta-données pour décrire les ressources qui rendent possibles des systèmes plus performants de recherche d’information [http://dublincore.org/about/]. La version “unqualified” ou simple du Dublin Core est limitée aux 15 éléments principaux du Dublin Core Metadata Element Set [http://dublincore.org/resources/faq/#whatisthedifference].

Le protocole ne gère donc pas les accès aux documents. Si beaucoup d’utilisateurs du OAI­PMH manifestent pour un accès ouvert et gratuit à la documentation qu’ils hébergent, cet engagement ne participe pas à l’OAI. D’ailleurs, l’utilisation du protocole est ouverte à tous et des éditeurs commerciaux peuvent très bien l’utiliser [Lynch 2001].

Il est difficile, voire impossible, de donner une liste complète des fournisseurs de données utilisant le protocole de l’OAI. Ceux­ci n’étant pas obligés de se faire connaître. Jusqu’à présent, 178 dépôts de tout type sont enregistrés sur le site de l’OAI [http://www.openarchives.org/Register/BrowseSite.pl]. Un des services qui utilise les méta­données issues du protocole, oaister, permet la recherche à travers les dépôts de 327 institutions [http://oaister.umdl.umich.edu/o/oaister/]. Les fournisseurs de services sont beaucoup moins nombreux, nous en trouvons 17 sur le site de l’Open Archives Initiative [http://www.openarchives.org/service/listproviders.html].

Le succès rencontré par l’OAI­PMH est sans doute du au fait qu’il peut être utilisé par tous les producteurs d’information qui le désirent. Il est ainsi utilisé aussi bien par des éditeurs commerciaux comme BioMed Central que par des institutions universitaires (California Institute of Technology, Australian National University, University of Southampton,…). Sa simplicité, voulue par ses créateurs, est également facteur de succès; il peut être d’application pour toutes sortes de documents : e­prints, livres, contribution à une conférence,… Ces deux avantages et le côté pionnier de l’OAI font de celle­ci le fédérateur sans doute le plus connu dans le domaine des fournisseurs de documentation en ligne orienté Open Access.

Lire le mémoire complet ==> (Réflexions sur quelques nouveaux modèles de communication scientifique)
Diplôme d’études spécialisées (D.E.S.) en sciences et technologies de l’information
Université Libre de Bruxelles – Faculté de Philosophie et Lettres Section Infodoc