ArXiv : e-print archive, un modèle de communication scientifique

By 18 March 2013

Des nouveaux modèles de communication scientifique – Chapitre 3.

1. Les archives thématiques

Les archives thématiques ou disciplinaires sont moins attachées à une institution qu’à une communauté de chercheurs. C’est dans ce modèle que nous retrouvons la première alternative aux éditeurs commerciaux : arXiv qui est également notre premier exemple.

1.1. ArXiv : e-print archive
http://xxx.arxiv.org

ArXiv est une archives thématique concernant premièrement et principalement les physiciens, communauté habituée à la circulation des pré­tirages, sur support papier comme sur support électronique.

1.1.1. Historique

Premier projet du genre, arXiv est lancé et développé en 1991 par Paul Ginsparg, physicien membre du laboratoire de Los Alamos [http://en.wikipedia.org/wiki/Paul_Ginsparg]. Aujourd’hui, il est présenté comme suit sur le site officiel :

“ArXiv is an e-print service in the field of physics, mathematics, non-linear science, computer science, and quantitative biology. The content of arXiv is conform to Cornell University academic standards. ArXiv is owned, operated and funded by Cornell University, a private not-for-profit educationnal institution. ArXiv is also partially funded by the National Sciences Foundation.”

En 2001, Paul Ginsparg a quitté le laboratoire de Los Alamos et est devenu professeur à l’université Cornell, le projet arXiv a également effectué ce déplacement.

Les premiers documents accueillis dans cette archive concernaient principalement la physique. Au fil du temps, le domaine d’application s’est élargi et concerne aujourd’hui les mathématiques, l’informatique et la biologie quantitative [http://en.wikipedia.org/wiki/ArXiv.org_e­print_archive].

Prendre cette initiative était une manière de contourner les délais et les coûts imposés par la publication sur support papier. Il faut ajouter que l’utilisation de prétirages4 était déjà courante parmi les physiciens [De La Vega 2000, p.126], la mise en ligne qui permet une accessibilité immédiate est donc dans l’ordre des choses; arXiv a, d’une certaine manière, permis l’informatisation d’une pratique habituelle.

4 Prétirage, preprint : “article soumis à publication à une revue, non encore publié et destiné à l’être, qui circule de façon informelle dans la communauté. Il fait partie de ce qui est défini plus largement sous le terme de “littérature grise”” [De La Vega 2000, p. 125].

1.1.2. Technique et fonctions

Fonctionnement général

Les documents disponibles sur arXiv doivent obligatoirement concerner l’un des domaines suivants : physique, mathématiques, sciences non linéaires, informatique et biologie quantitative. Il s’agit de textes scientifiques et techniques. L’archive n’est pas utilisable pour diffuser d’autres types d’information (telles que des opinions, des nouvelles du monde politique ou académique, …).

Le dépôt de texte est ouvert à tous. Chaque contribution est soumise à un spécialiste du domaine et depuis peu, un système d’acceptation (endorsement) des nouveaux auteurs a été mis en place. Ceux­ci doivent se trouver un “parrain” reconnu par arXiv pour pouvoir soumettre leurs articles. Le texte doit répondre à certains critères techniques comme le format (LATEX, de préférence) et le “poids” du document. Il doit également être accompagné d’un résumé et être rangé dans une des subdivisions (éventuellement plusieurs mais ce n’est généralement pas utile au vu des domaines extrêmement précis qui sont couverts).

Il est possible pour un auteur de publier une nouvelle version de son travail mais les anciennes resteront accessibles.

L’accès au texte, quant à lui est libre et gratuit. De nombreux sites miroirs5 facilitent cet accès en répartissant les requêtes et les accès aux documents sur plusieurs serveurs.

La page d’accueil se veut avant tout pratique, elle permet de rentrer directement dans le vif du sujet. Elle présente les différents domaines et leurs subdivisions. Pour chacun des domaines et certaines subdivisions, il est possible d’accéder directement aux nouveaux abstracts (new), aux abstracts et articles les plus récents, c’est­à­dire déposés dans les cinq derniers jours où il y a eu des dépôts (recent), de rechercher des abstracts (abs) et des documents archivés dans les différentes subdivisions (find).

La page d’accueil propose également plusieurs liens “à propos d’arXiv” qui sont destinés aux utilisateurs tant du côté de ceux qui cherchent des informations que de ceux qui publient des textes.

Recherche d’information

La recherche de documents peut être effectuée de deux manières différentes : l’utilisateur peut envoyer sa requête via e­mail6 ou bien utiliser l’interface web. Cette seconde solution sera envisagée plus en profondeur.

La recherche à partir du site s’effectue obligatoirement au sein d’un domaine; il n’est pas possible d’effectuer une recherche transversale sur l’ensemble des documents. Dans le cas d’une recherche en physique, il est possible très simplement de se limiter à une ou plusieurs subdivisions.

6 Le destinataire du mail définit le domaine concerné, la requête elle-même est à indiquer dans le sujet du mail. Elle est, néanmoins, restreinte à la recherche de mots-clés dans les champs “auteur” et “titre”; il est également possible de demander un document dont on connaît l’identifiant; les différentes commandes possibles sont détaillées sur le site.

Les autres moyens de limiter sa recherche sont : la limitation chronologique (par défaut, une recherche s’effectue sur l’année en cours et non sur l’ensemble des années) et la limitation sur les champs de recherche (auteur, titre, contenu de l’abstract, contenu du document, commentaires, référence du périodique dans lequel l’article a éventuellement été publié, classification (Association for Computing Machinery, Mathematic Subject Classification ou arXiv), numéro de rapport).

Les résultats d’une recherche présentent premièrement la classification par sujet, le numéro de document, le titre, les auteurs (et l’institution à laquelle ils sont rattachés), les éventuels commentaires. Ils donnent également accès à l’abstract et au texte entier (au format .ps, .pdf ou autres).

Sur le site d’arXiv, aucune mention n’est faite concernant l’interopérabilité du dépôt ou le respect de l’un ou l’autre protocole pour la recherche d’information. Néanmoins, sur le site de l’Open Archive Initiative [http://www.openarchives.org/Register/BrowseSites.pl], il est mentionné comme soutenant le protocole OAI. ArXiv fait également partie des dépôts sur lesquels il est normalement possible d’effectuer une recherche (sur les méta­données uniquement) depuis le site Oaister [http://oaister.umdl.umich.edu/o/oaister/viewcolls.html].

1.1.3. Situation actuelle

Les statistiques d’utilisation disponibles sur le site [http://arxiv.org/show_monthly_submissions] montrent que depuis 1991, le nombre de documents soumis tous les mois suit une tendance forte à la hausse; même si certains mois sont plus creux (en début et milieu d’année, soit les congés académiques habituels). Au 23 juin 2004, le nombre total de documents disponibles s’élevait à 279 628 (disponibles égalements depuis les 17 sites miroirs).

Actuellement, arXiv en tant que pionnier, bénéficie d’une certaine réputation dans le monde des scientifiques. Cette réputation et le fait qu’il s’agit d’un système bien rodé (mis en place en 1991, nous pouvons supposer qu’aujourd’hui, tout fonctionne correctement) font la force d’arXiv.

Ajoutons à cela qu’il a été mis en place au sein d’une communauté habituée à communiquer de manière informelle via les pré­tirages et qui privilégie la rédaction d’articles plutôt que de monographies. Tout laisse à croire qu’arXiv restera fonctionnel pour encore un certain temps.

Néanmois, nous pouvons nous poser la question de l’avenir d’arXiv une fois que Paul Ginsparg, son concepteur, se retirera. Comme expliqué dans l’historique, arXiv a fait avec lui le trajet de Los Alamos à Cornell, que se passera­t­il plus tard si Paul Ginsparg quitte Cornell ? Il faut espérer que la relève sera assurée, au risque de voir arXiv tomber en désuétude faute d’un animateur dynamique.

Malgré ces avantages, certains inconvénients peuvent être cités. L’interface graphique, si elle est très efficace n’est pas pour autant très conviviale. L’université californienne de Davis donne accès à une interface de recherche pour la partie mathématique d’arXiv [http://front.math.ucdavis.edu/] qui n’offre pas de fonctionnalités supplémentaires mais qui permet d’effectuer une recherche dans un environnement plus agréable. Cette interface graphiquement pauvre est sans doute à considérer comme un moyen de faciliter l’accès du site aux personnes qui ne disposent pas de connexion rapide à Internet. Le site reste ainsi accessible à un plus grand nombre de personnes.

Un autre inconvénient est l’absence de peer review. Au départ, les soumissions étaient évaluées par une personne experte du domaine. Depuis janvier 2004, un système d’acceptation (endorsement) a été mis en place. Pour pouvoir soumettre un texte et être publié sur arXiv, un auteur doit se faire “parrainer” par un scientifique de son domaine qui a déjà publié des articles dans arXiv. Ce système a été mis en place pour garantir la qualité des publications d’arXiv alors que le nombre de soumissions augmente.

ArXiv présente donc certains avantages aux physiciens, mathématiciens et autres qui veulent publier leur production ou rechercher de l’information, notamment par la gratuité de ces deux types de démarche et par la réputation acquise au fil du temps.

Lire le mémoire complet ==> (Réflexions sur quelques nouveaux modèles de communication scientifique)
Diplôme d’études spécialisées (D.E.S.) en sciences et technologies de l’information
Université Libre de Bruxelles – Faculté de Philosophie et Lettres Section Infodoc