Navigation – Plan du site
La Lettre n° 34 | Réflexion sur...
Jacqueline Nivard
Crédits : Wang Ju

Les archives ouvertes

Questions à Jacqueline Nivard, chargée de mission

Qu’est-ce qu’une archive ouverte ?

Une archive ouverte est un site où les documents sont en libre accès (Open access). Les chercheurs y déposent leurs articles en texte intégral dans le respect des droits d’auteur ou leurs références bibliographiques. L’expression « archive ouverte » traduite de l’anglais Open Archive, peut être employée au singulier ou au pluriel (Open Archives). On parle aussi souvent de « réservoir » ou d’« entrepôt de documents » (traduction de l’anglais Repository).
Les archives ouvertes suivent le protocole d’échange des données OAI-PMH « The Open Archives Initiative Protocol for Metadata Harvesting ». Cela permet aux moteurs de recherche spécialisés dans le moissonnage des serveurs d’archives ouvertes (harvesters) d’interroger simultanément tous les entrepôts pour une même requête.
HAL (Hyper article en ligne) est une archive ouverte pluridisciplinaire créée en 2001 par le Centre pour la communication scientifique et directe (CCSD) – par des chercheurs, pour des chercheurs – avec pour objectif le partage des résultats de la recherche. Elle propose des portails thématiques comme HAL-SHS , archive ouverte des sciences de l'homme et de la société, et des portails institutionnels. HAL « archive nationale » pour la France s’inscrit dans le mouvement pour le libre accès, défini à Budapest en 2002 et réaffirmé à Berlin en 2003.

Qu’est-ce le libre accès ?

Le libre accès ne se limite pas aux archives ouvertes. Il y a deux voies possibles et une solution hybride proposée par les éditeurs :
- la voie verte (Green road) qui est le dépôt de travaux directement par le chercheur lui-même ou par une personne mandatée dans une archive ouverte comme Hal. On trouve la liste des archives ouvertes dans OpenDOAR The Directory of Open Access Repositories ;
- la voie dorée (Gold road) qui est la mise en ligne d’articles acceptés par les comités de rédaction sur des plateformes de revues scientifiques comme Revues.org, Persée, etc. On trouve la liste de ces revues dans le DOAJ Directory of Open Access Journals ;
- il existe enfin une  voie hybride proposée par les éditeurs en réaction à la montée des archives ouvertes,  qui suppose que les auteurs, leurs institutions ou les agences de recherche financent en amont la mise en ligne d’articles mis en libre accès.

Que dépose-t-on dans HAL ?

Un chercheur peut déposer dans HAL (avec l’autorisation du ou des co-auteurs) :
- des documents de qualité équivalente à celle des articles qu’il  soumettrait  à une revue avec comité de lecture ;
- des documents pour lesquels il dispose des droits d’auteur ;
- des articles en texte intégral ou des références bibliographiques si le dépôt du texte intégral n’est pas possible.
Les thèses et les HDR peuvent également être déposées dans HAL après la soutenance. Depuis mars 2010, on peut même exporter directement une thèse vers TEL depuis STAR qui est la plateforme de dépôt des thèses. Un guide du dépôt et du bon usage dans HAL est disponible sur le site de l’archive. On y trouve toutes les informations nécessaires pour apprendre à déposer sur HAL.

Qu’est-ce qu’une collection ?

HAL permet de « faire des collections », c’est-à-dire de sélectionner des documents qui seront déposés selon une démarche institutionnelle ou thématique. La page de consultation des données pourra être personnalisée (gestion du graphisme et contenu). La formule est souple. Il est possible de créer une collection pour une institution, une UMR, un laboratoire, une équipe. Des chercheurs travaillant sur une même thématique et des aires géographiques différentes peuvent aussi créer une collection pour donner plus de visibilité à un axe de recherche, ou à l’occasion d’un colloque, par exemple.

Qu’est-ce qu’un portail ?

Un portail fonctionne comme une collection, mais avec des fonctions supplémentaires, par exemple l’utilisation d’un nom de domaine propre dans son URL  (http://hal-ens.archives-ouvertes.fr/, portail de l’ENS) ou l’intégration d’un thésaurus pour les mots clés. Ainsi l’archive ouverte de ParisTech regroupe les publications des membres du PRES ParisTech. Certaines grandes écoles et certaines universités ont également des « collections ».
- une collection permet d’agréger sur le critère de l’affiliation tous les dépôts faits dans un portail HAL.
- un portail n’affiche que les documents qui ont été déposés depuis ce portail. Ainsi, par exemple, si nous mettions en place un portail HAL-EHESS, ce portail ne pourrait pas afficher les dépôts d’articles ayant un co-auteur EHESS mais dont le dépôt serait fait sur le portail de Paris 1.

Que deviennent actuellement les documents des chercheurs de l’EHESS qui déposent déjà dans HAL ?

C’est un problème important. Les dépôts des chercheurs de l’EHESS ne sont pas suffisamment valorisés. Il y a actuellement un site d’extraction automatique qui propose plus de 2000 dépôts sans graphisme, sans mise en page et surtout sans que les données aient été validées par une personne responsable de la base ! L’absence de responsable de collection conduit à une validation automatique sur le seul critère de l’affiliation EHESS. Un portail est déjà mis en œuvre depuis longtemps à l’EHESS, celui de l’Institut Jean Nicod qui compte plus de 600 dépôts.
Les centres de l’École commencent à développer des collections car c’est une solution fonctionnelle et facile à mettre en place pour diffuser les publications. Citons les principales collections de l’EHESS :
- Institut interdisciplinaire d'anthropologie du contemporain (IIAC) http://halshs.archives-ouvertes.fr/AO-IIAC, 474 articles en texte intégral
- Centre International de Recherche sur l'Environnement et le Développement (CIRED) http://hal.archives-ouvertes.fr/CIRED, 152 articles et  37 notices
- Centre A.-Koyré / Centre de recherche en histoire des sciences et des techniques http://halshs.archives-ouvertes.fr/CAK-CRHST/fr, 63 articles, 51 notices
- Centre d'études turques, ottomanes, balkaniques et centre asiatiques (CETOBAC ex ETO) http://halshs.archives-ouvertes.fr/ETO/fr/, 44 articles, 3 notices
- Groupe d'anthropologie scolastique (GAS) http://halshs.archives-ouvertes.fr/GAS/fr/, 35 articles, 10 notices
Centre Norbert Elias (ex Shadyc) http://halshs.archives-ouvertes.fr/SHADYC/fr/, 39 articles.

Certaines collections HAL sont intégrées dans les sites de centre, c’est le cas pour les collections des centres sur l’Asie :
- Centre de recherche sur la Chine moderne et contemporaine (CECMC) http://halshs.archives-ouvertes.fr/ACC/fr/, 26 articles, 355 notices
- Centre d’études de l’Inde et de l’Asie du Sud (CEIAS) http://halshs.archives-ouvertes.fr/CEIAS/fr/, 14 articles, 5 notices
- Centre de recherche sur la Corée (CRC) http://halshs.archives-ouvertes.fr/AOCRC/fr/, 8 articles, 67 notices
- Centre de recherche sur le Japon (CRJ) http://halshs.archives-ouvertes.fr/CRJ, 1 article, 111 notices.

Les collections à l’EHESS sont en général gérées par les documentalistes/bibliothécaires. Parfois une personne est dédiée à cette responsabilité, comme au IIAC, où près de 500 articles sont en ligne en texte intégral, en raison de l’engagement fort de la direction du laboratoire, qui encourage le dépôt.

Qui valide l’entrée du document dans la base de données HAL et dans une collection ?

Les documentalistes du CCSD font une première évaluation technique (appartenance de l’auteur, conformité du type de document, vérification des droits, etc.), mais c’est l’auteur qui est responsable du contenu de son dépôt. HAL contient des preprints, des documents avant validation par les pairs.
Le document déposé dans HAL peut être versé dans une collection automatiquement ou manuellement. C’est ce que l’on appelle le « tampon » dans le vocabulaire HAL. Un directeur de centre peut désigner un « tamponneur », ou un référent. Le « tamponneur » gère la collection. Il validera l’entrée d’un dépôt et pourra aussi supprimer des documents (« détamponner »). C’est aussi lui qui gère la personnalisation de la page d’accueil (contenu et graphisme). Le référent aura les mêmes fonctions que le « tamponneur » mais il pourra aussi modifier les métadonnées des documents.

Déposer dans HAL, pourquoi ?

Il est utile de déposer dans HAL pour donner de la visibilité à la recherche :
- visibilité du chercheur, de son laboratoire mais aussi de l’établissement au niveau national et international (un article disponible en ligne est plus lu qu’un article sur papier) ;
- visibilité des équipes par rapport aux financeurs de la recherche (Champ « Projet ANR »), l’Agence Nationale de la Recherche (ANR) incite depuis 2007 les chercheurs à intégrer leurs publications dans le système d'archives ouvertes ; un champ « Projet européen » a été ajouté dans les métadonnées de HAL ;
- visibilité pour les jeunes chercheurs avec l’articulation possible du dépôt de leurs thèses dans STAR (il suffit de cocher une case dans l’application STAR) ;
- visibilité à long terme avec l’archivage quotidien depuis mars  2010 des données de HAL dans le Centre informatique national de l’enseignement supérieur (CINES).
HAL garantit la visibilité mais aussi la pérennité du dépôt avec des URL stables. Un document mis en pdf sur une page de chercheur à une adresse peut disparaître au fil des années en fonction des remaniements du site.

Le dépôt dans HAL : le travail des documentalistes/bibliothécaires ou des chercheurs ?

Certains directeurs de centre comprennent bien l’importance du dépôt et confient cette tâche aux bibliothécaires ou aux documentalistes, parfois même aux secrétaires de centre. De plus en plus de bibliothécaires prennent en charge les archives ouvertes et les voient comme de nouvelles formes de médiations documentaires. Les bibliothèques de Sciences Po et de Dauphine ont toutes deux mis en place des archives ouvertes institutionnelles.
Cette question fait débat : certains, comme l’université de Liège, estiment que le dépôt doit être fait par le chercheur lui-même qui doit assumer sa responsabilité vis-à-vis des éditeurs, dans la pratique il s’avère souvent qu’il vaut mieux confier cette mission aux documentalistes ou aux bibliothécaires qui sont mieux informés et plus conscients de l’importance des métadonnées pour une bonne indexation des documents. Dans l’archive institutionnelle de Toulouse, l’OATAO , ce sont les chercheurs qui déposent les documents mais ce sont les documentalistes qui remplissent les métadonnées.

Est-ce que l’archive ouverte HAL est devenue un outil d’évaluation ?

Si elle n’a pas été conçue comme un outil d’évaluation, elle est de plus en plus utilisée à des fins bibliométriques. Elle est « ratissée » par les moteurs de recherche scientifiques comme Google Scholar et Scirus, mais aussi par les moissonneurs OAI comme OAISTER (mis en place par l’université de Michigan et maintenant intégré dans Worldcat).

Quelles sont les politiques des autres établissements par rapport au dépôt systématique des travaux dans une archive ouverte ?

Conscientes de l’impact des travaux mis en accès libre sur Internet, de nombreuses universités aux États-Unis, comme Harvard ou le MIT, ont rendu obligatoire le dépôt des résultats de la recherche dans leur archive institutionnelle. En Europe, l’université de Minho au Portugal a initié le mouvement en 2005. L’expérience de l’université de Liège, plus récente, est intéressante. Cette université a pris une position radicale en instaurant un mandat ULg (traduction de l’anglais mandate), c’est-à-dire en demandant à ses chercheurs de déposer leurs articles publiés depuis 2002 dans leur archive institutionnelle (ORBI Open Repository and Bibliography). Les chercheurs ont bien accepté, semble-t-il, (voir le blog de Bernard Rentier, recteur de l’université), cette décision qui donne plus de visibilité à leurs travaux.

Faut-il déposer le texte intégral ou au moins la référence de ses travaux dans une archive ouverte comme HAL pour avoir une meilleure visibilité et construire une bibliothèque numérique des travaux des chercheurs de notre établissement ? La question est posée.