Systèmes de gestion de contenu: Gestion des bibliothèques physiques

By 24 July 2013

A. LES SYSTEMES DE GESTION DE CONTENU (CMS)

1 Cas d’utilisations

Ce chapitre est une présentation générale et synthétique des domaines de la gestion de contenu. Il permet une familiarisation avec les utilisations concrètes qui sont faites des concepts de la gestion de contenu. De même, il aborde les grandes fonctionnalités de chaque domaine.

1.1. Gestion des bibliothèques physiques

Une des premières grandes applications traditionnelles de la gestion de contenu est la gestion physique des bibliothèques.

Les deux grands acteurs des bibliothèques sont les documentalistes (bibliothécaires) et les membres (utilisateurs). Traditionnellement, l’objet géré est le livre au format papier et s’étend aujourd’hui à l’ensemble des médias disponibles sur un support physique : périodiques (journaux), disques de musiques (CD audio), vidéos (cassettes VHS, DVD). La bibliothèque s’appelle désormais médiathèque.

L’activité principale de la bibliothèque est la mise à la disposition de ses ressources à l’usager pour l’emprunt (ou réciproquement le prêt).

Cependant, afin d’offrir un service attrayant, elle va chercher à proposer le plus de « titres », c’est à dire des références, à ses membres abonnés. Une fonction centrale est donc l’acquisition de ressources.

Le volume d’objets gérés dans une bibliothèque dépasse en général plusieurs milliers. Face à ce volume, le besoin d’une gestion informatisée de ces références s’est fait sentir. Aussi, les SIGB (Systèmes Intégrés de Gestion des Bibliothèques) ont-ils été parmi les premières applications informatiques professionnelles. Le plan de classement est donc un des outils fondamentaux d’une bibliothèque. La référence d’un ouvrage reprend les informations de l’emplacement de l’objet dans le bâtiment et les étagères.

Afin de mettre en valeur leur offre, les bibliothèques proposent un catalogue de leur fonds bibliographique. Le fonds bibliographique est l’ensemble des œuvres et de leur description que possède la bibliothèque. Chaque œuvre fait donc l’objet d’une notice (terme professionnel du monde de la documentation) qui reprend l’ensemble des informations décrivant une œuvre. Cette notice fait l’objet d’une norme internationale qui est UNIMARC [1] (MARC – Machine Readable Catalogue – ISO

2709) décrivant le fonds et la forme d’une notice [2] [3]. La bibliographie est donc rédigée et gérée sous forme de notice et peut contenir avec le format UNIMARC jusqu’à 400 champs descriptifs environ. Les champs les plus importants sont le titre, l’auteur, les mots clés et la catégorie de l’ouvrage.

La catégorisation, dont les synonymes sont taxonomie, classification, est le « rangement » logique de l’œuvre par domaine, ou encore par sujet. Confronté à l’objectif de classer l’ensemble des ressources bibliographiques existantes, les bibliothécaires ont créé plusieurs classifications universelles dont l’Universal Decimal Classification (UDC1) et la Dewey Decimal Classification (DDC2).

Un des travaux les plus importants des documentalistes est la rédaction de bibliographies sur les ouvrages. Ce sont aujourd’hui les champions des méta données. Ils favorisent ainsi, en « digérant » l’information, l’accès aux ressources. A ce titre, ils ont été les premiers à mettre en œuvre concrètement la notion de méta donnée. Ils jouent donc un rôle important dans la gestion de la connaissance (knowledge management) en permettant l’accès aux ressources documentaires, notamment aux apprenants, mais aussi aux chercheurs, grands utilisateurs des bibliothèques, notamment celles à vocation professionnelle.

Toujours dans l’optique de proposer un service qui permette d’accéder à l’ensemble des ressources existantes dans le monde, c’est à dire un service universel, les bibliothèques ont conclu des alliances afin de mutualiser leurs fonds bibliographiques. Ainsi un membre d’une bibliothèque est membre des bibliothèques associées. On parle alors de prêt inter-bibliothèques. Ou encore, elle propose à l’usager d’interroger le fonds d’autres bibliothèques ; charge à lui d’emprunter la ressource auprès de la bibliothèque la possédant. Une norme permettant l’interrogation inter-catalogue et la récupération des informations bibliographiques est la norme ISO 23950 [4] mise en œuvre dans les serveurs Z39.503 [4] [5].

Aujourd’hui, les bibliothèques sont confrontées à la numérisation [6] des ressources qu’elles gèrent [7]. On pourrait imaginer, avec la tendance actuelle, qu’elles disparaissent au fur et à mesure de la numérisation des œuvres pour être remplacées par des systèmes de gestion électronique de document (GED). Ou encore, certains nouveaux documents n’existent maintenant qu’uniquement sur format numérique et sont en tout cas crées au format numérique. Dans ce nouveau monde, la notion de prêt n’a plus cours, le coût de la duplication et de la distribution de l’œuvre étant négligeable. La gestion des droits numériques (DRM – Digital Rights Management), notion afférente au droit d’auteur (copyright) prend le relais.

C’est d’ailleurs la gestion des emprunts (de livre) qui fait l’objet de l’autre activité majeure des bibliothèques. On parle de bibliothéconomie (l’ensemble des techniques de gestion du livre dans les bibliothèques : conservation, rangement, communication…).

Inversement, on continuera certainement à utiliser et gérer des documents (notamment les livres) sous des formats physiques pendant un temps non négligeable. Chaque entreprise possède de manière formelle ou informelle une bibliothèque. L’utilisation d’un système de gestion intégré des bibliothèques peut donc être une des applications de la gestion de contenu dans les entreprises.

L’édition et l’utilisation des méta données pour accéder à des ressources physiques est la fonctionnalité majeure que l’on peut retenir de la gestion des bibliothèques.

1.2. Edition de document composite

L’édition de documents composites (« compound documents » en anglais) est aussi une technique éprouvée depuis maintenant plus d’une décennie. Les entreprises souvent citées sont celles de l’industrie aéronautique [8] ou pharmaceutique et médicale [9]. En fait la problématique de l’édition de document composite, à travers l’édition de la documentation technique, s’étend là encore à tous les secteurs d’activité, même si l’édition (secteur du livre) est plus particulièrement visée [10].

Il s’agit premièrement de créer (mettre à jour) un document qui se décompose en parties rédigées par des rédacteurs multiples. On aborde là un élément majeur de la gestion de contenu : le document « final » est décomposé en sous-éléments fils, ou encore sous-composants. Autrement dit, il s’agit de structurer les documents autant que possible selon un modèle spécifique à chaque type de document. Un autre élément qui se déduit de cette définition est le travail collaboratif : plusieurs auteurs interviennent ensemble sur le même document, en parallèle ou séquentiellement, parfois avec des rôles différents, notamment d’écriture ou de validation [11]. Une documentation technique en vient à être considérée ainsi comme un projet et gérée avec des outils communs.

La décomposition des documents ouvre la porte à leur recomposition et donc à des formats de sortie variés, tant sur la forme que sur le fond. La réutilisation des composants documentaires est rendue possible.

Pratiquement chaque produit ou service requiert une documentation associée. Les entreprises pionnières dans ce domaine considèrent la documentation technique comme un produit « manufacturé » qui doit satisfaire des contraintes de planification. Ces compagnies planifient en tandem le cycle de vie d’un produit et sa documentation associée. La distribution de la documentation technique [12] présente aussi plusieurs problèmes. Les manuels au format « papier » sont appropriés pour un grand nombre d’applications, mais sont chers à produire et distribuer et ne peuvent pas être mis à jour facilement. Les attentes des utilisateurs, notamment les clients, pour accéder à l’information technique croissent. Les clients veulent une documentation imprimée (ou imprimable), une aide en ligne et un accès via Internet à l’information adéquate. Les clients du support technique ont aussi besoin de ressources techniques écrites, alors que les services de formation utilisent la même information de manière différente. Un défi de taille est d’éditer cette information de manière efficace afin qu’elle soit distribuée à une grande variété de publics dans des formats différents.

Dans l’industrie automobile, le cycle de vie de l’information commence généralement avec les données d’ingénierie (notes, cahier des charges, spécifications, résultats de tests et plans). Ensuite viennent les informations comme celles nécessaires à la maintenance et l’utilisation des véhicules, au support de fabrication et au matériel de formation des agents. L’entreprise doit pouvoir facilement collecter, réorganiser et maintenir cette information tout en maintenant une cohérence irréprochable entre ces documents qui peuvent parfois concerner différentes lignes de produits.

Considérons les opportunités de réutilisation pour seulement un type de document, le manuel du conducteur, fourni avec chaque nouveau véhicule. La procédure pour changer un pneu, par exemple, doit être la même pour tous les modèles de véhicule d’un fabricant donné ! Comparez la gestion unifiée du contenu avec le fait de devoir écrire et mettre à jour cette documentation séparément pour chaque modèle de véhicule. Sachant que distribuer dans une forme utilisable et à jour la documentation pour chaque utilisateur, du mécanicien débutant au gestionnaire de flotte, est compliquée par des changements fréquents et réguliers dans la fabrication des véhicules : un modèle de voiture standard est re-conçu chaque trois-cinq ans alors que des changements de fabrication de moindre importance sont introduits tous les six mois ! Au total, ce sont des centaines de procédures qui sont reproduites à tous les niveaux alors que quelques-unes uniquement changent mais pas systématiquement pour les dizaines de modèles de véhicules que produit la société automobile.

Quand il s’agit de l’industrie aéronautique ou nucléaire [13], les contraintes de sécurité (par rapport au risque d’accident mais aussi de piratage) sont telles que les processus d’écriture et de mise à jour doivent être soumis à des schémas de validation et d’approbation complexes et lourds, amplifiés par le fait que l’accès à ces mêmes informations doit être strictement réglementé.

Une des principales difficultés que rencontrent les industries qui favorisent la gestion de contenu appliquée à leur documentation technique est la variété des sources de contenu : schémas et dessins (plans) issus d’outils de CAO et DAO (conception et dessin assistés par ordinateur), textes sous de multiples formats. Par ailleurs, la mise en forme des « sorties » des documents doit répondre à des exigences fortes de présentation (ergonomie) en fonction des utilisateurs. L’intégration entre le CMS et les autres applications d’édition de documents (ou de données) est indispensable pour maintenir la cohérence des données.

Les systèmes de gestion de contenu utilisés mettent donc en oeuvre la séparation du contenu et de leur mise en forme. Ainsi l’auteur ne travaille plus sur une mise en forme fine (application de taille, de typographie, de style : police, couleur…) lors de la rédaction mais sur l’association d’étiquettes (tags) avec les différents éléments de son document. La mise en forme est ensuite appliquée aux éléments en fonction des étiquettes, automatiquement, après développement d’un fichier (script) de transformation, en fonction du format de sortie désiré. Les documents doivent alors être rédigés à partir de gabarits (template) ou autrement dit sur la base de modèles de document. Les applications d’édition de documents peuvent aussi appliquer des contrôles en fonction de la structure du document : si un élément n’est pas renseigné, l’auteur, par exemple, ne peut pas enregistrer le document créé ou mis à jour ou tout du moins, ne peut pas soumettre son document dans le processus de mise à jour. Cela réduit le risque d’erreur grâce à un contrôle a posteriori de la structure du document avec celle du modèle.

Grâce à la séparation du contenu et de la mise en forme, non seulement la mise en forme peut être choisie ultérieurement, et être multiple alors que le contenu reste unique. Mais on peut aussi rajouter des fonctions de traitement automatique telles que la réalisation d’un sommaire, d’index, de liste des illustrations ou autres qui aident l’utilisateur final (le lecteur) dans sa navigation dans le document. D’autres fonctions concernent la finition des livres (document volumineux) comme la mise à jour des références croisées internes, la synthèse de hauts et de pieds de page. De même, la traduction des documents peut être assistée par ordinateur et rendue plus pertinente grâce à ces étiquettes, que l’on peut assimiler à des méta données dans la plupart des cas.

Les pages html des sites web sont aussi des documents composites puisqu’elles peuvent contenir des fichiers associés : images, sons, vidéos… Parfois, certaines images, par exemple, sont partagées entre plusieurs pages et donc réutilisées. Aujourd’hui, sur certains sites web (presse, portails grand- public), ces pages sont de véritables assemblages de composants de sources multiples, dont les contenus sont mis à jour par des entreprises différentes à des fréquences très rapides (météo, cours de la bourse, nouvelles d’agence de presse, alertes diverses). Nous aborderons leur utilisation dans les chapitres 1.4. et 1.5..

Lire le mémoire complet ==> (Les systèmes de gestion de contenu : description, classification et évaluation)
Mémoire présenté en vue d’obtenir le DIPLOME D’INGENIEUR C.N.A.M. en informatique
Conservatoire National Des Arts Et Métiers – Paris