La gestion documentaire et les système de gestion de contenu

By 24 July 2013

1.3. Gestion documentaire (référentiel d’entreprise)

La gestion documentaire est un domaine traditionnel dans la gestion de l’entreprise au sens large. Toutes les entreprises y sont confrontées indirectement (administration et finance, notamment le courrier entrant et sortant, documentation technique), et certaines directement (productions intellectuelles – presse, édition, conseil…). De même, la numérisation des ressources y joue un rôle majeur.

Si l’on regarde la définition [14] du mot document :

« n. masc. Écrit, objet ayant valeur de preuve, de témoignage ou d’information. Document historique, scientifique, photographique. Cet enregistrement est un document rare. Document humain : scène (vue ou filmée) qui fournit des renseignements sur les mœurs d’une société, d’un groupe. COMM. Titre accompagnant une marchandise dans son transport (connaissement, police d’assurance, facture). Document comptable : pièce servant de base à une écriture comptable », on comprend le cœur de la seconde génération de système de gestion de contenu regroupée sous l’acronyme GED. Il s’agit de fiabiliser ou permettre, en cas de volumes important (chèques bancaires par exemples), l’archivage des documents afin de restituer la preuve le cas échéant. D’où aussi, les normes du domaine (NF Z 42-013 et ISO 15489-1) qui garantissent le système et donnent une valeur légale aux documents électroniques. D’où là encore l’intégration des normes concernant l’authentification des documents à l’aide de certificats numériques (signature électronique).

Cette évolution est très importante pour l’administration et la gestion (comptabilité) puisque les factures, justificatifs jusque là archivés et stockés sous format papier vont pouvoir être archivés sous format électronique. Ainsi, sur le site de l’APROGED (Association des Professionnels de la Gestion Electronique de Documents), on donne l’exemple du comptable. Celui ci aujourd’hui retrouve une ligne comptable (une écriture) en 1 à 2 secondes en moyenne dans son système informatique. Par contre, il lui faut entre 5 et 15 minutes pour trouver le justificatif correspondant. Il y a donc un gain de productivité important à attendre de la numérisation des documents administratifs et comptables dans un système compatible ISO 15489-1 [15].

L’association internationale regroupant les acteurs de la GED est l’AIIM, « l’Enterprise Content Management Association », anciennement « Association for Information and Image Management »4.

La GED est aussi appelée GEIDE pour Gestion Electronique d’Informations et de Documents Existants. Pour échanger des documents issus ou à destination de système de GED, on utilise l’EIDE (Echange d’Informations ou de Documents Electronique) qui tend à être normalisée avec un format compatible XML. Toutefois, cette norme n’a pas encore de reconnaissance internationale [16] [17].

La GEIDE a pour vocation de fédérer et de gérer tous les types de documents, y compris ceux qui se trouvent déjà sous une forme électronique. En plus des documents papier, les types de document les plus fréquemment rencontrés sont les suivants : télécopies, documents bureautiques issus de logiciels de traitement de texte, de tableurs, graphiques et plans, courriers électroniques, fichiers informatiques et en particulier les fichiers sons, images animées…

La numérisation des documents est au centre des techniques mises en œuvre dans les systèmes de GED. La lecture automatique de document (LAD) est une partie un peu restrictive de l’acquisition des documents dans le système de GED. Elle utilise le scanner pour numériser les documents papiers et les transférer sur un support électronique. Les autres documents sont sous format électronique. Il faut toutefois les traiter pour les inclure de manière correcte dans le système de GED. A chaque forme de document correspond un type d’appareil ou un dispositif logiciel : scanner, carte fax, logiciel de transfert de fichier.

L’acquisition peut comporter plusieurs étapes : par exemple l’interprétation ou la conversion de format du document, l’adaptation de sa structure et de sa composition, sa récupération par un dispositif de stockage ou de traitement.

En même temps que l’on saisit les documents, il faut procéder à l’acquisition des index qui serviront au classement et à la recherche ultérieure des documents. L’indexation est une étape essentielle et indispensable au bon fonctionnement d’un système de GEIDE. Du choix d’une méthode pertinente d’indexation jusqu’à la conception soigneusement étudiée des index, rien ne doit être laissé au hasard. Les index, dans la terminologie de la GED, correspondent aux méta données dans la terminologie de la gestion de contenu.

De ces index et du système d’indexation dépendent la performance du système de GEIDE et son adéquation aux besoins de l’entreprise. Pour acquérir des index, on a le choix entre plusieurs techniques, dont la plus simple mais aussi la plus adéquate dans de nombreux cas, est l’acquisition manuelle par remplissage d’un formulaire associé au document. On est confronté là à un des points noirs de la GEIDE car l’acquisition des index est une étape fastidieuse qui peut nuire à la rentabilité du système et entamer la motivation des utilisateurs. On peut acquérir ces index par d’autres méthodes qui dépendent des documents traités et des applications mises en oeuvre. Citons l’extraction automatique de mots-clefs par programme pour les documents électroniques formalisés du genre états informatiques (Intelligent Mark Recognition – IMR), l’analyse full-text (texte intégral) des documents, la reconnaissance optique de caractères (OCR) pour des textes dactylographiés ou manuscrits, l’utilisation de codes à barres ou toute combinaison de ces différentes techniques.

L’indexation des documents est l’opération qui consiste à décrire les documents en vue de leur exploitation ultérieure. La description d’un document va porter sur deux plans distincts mais complémentaires :

– une description externe contenant des informations sur le type de document, son origine, la date de sa prise en charge ou de sa création, pour les activités administratives ou techniques, le rattachement aux objets de base de l’entreprise (client, fournisseur, produit, etc., …),
– une description du contenu ; les enjeux de l’indexation et les difficultés se situent à ce niveau.

L’autre partie centrale de la gestion électronique de documents est l’archivage. Elle met en œuvre l’ensemble des techniques existantes dans ce domaine du moment qu’elles sont compatibles avec la norme NF Z 42-013 : SAN (Storage Area Network), disques RAID, support magnétique DAT, Compact Disc (Juke Box)… L’archivage nécessite impérativement de définir des règles pour le cycle de vie du document afin de pouvoir gérer sa destruction ou son enregistrement sur des supports inertes. Il est illusoire dans l’état de nos connaissances de garder l’ensemble des documents produits au cours de l’histoire d’une organisation.

Il faut citer maintenant une des fonctionnalités importantes des systèmes de gestion de contenu favorisée par la GED. Il s’agit de la gestion des versions de documents. La plupart des CMS propose aujourd’hui cette fonctionnalité qui permet d’accéder aux versions anciennes d’un document. Certains y ajoutent des extensions logicielles qui permettent de comparer les versions et de gérer les conflits de versions, notamment lors de mises à jour distribuées. L’intervention humaine en fin de traitement reste indispensable si le conflit nécessite un choix entre deux versions concurrentes.

On introduit ici une nouvelle dimension de la GED (mais pas spécifique) relative aux documents produits initialement sur support informatique. En plus du versioning, on va trouver la partie groupware et notamment la gestion des processus d’édition et de publication à travers ce qui est appelé communément le workflow.

Dans de nombreuses situations, la transmission et l’échange de documents entre plusieurs utilisateurs seront facilités ou organisés avec des outils tels qu’un logiciel de workflow ou un outil de groupware (groupe de travail).

Ces situations sont celles où plusieurs personnes travaillent en groupes organisés sur la base de règles et de procédures pour effectuer des travaux d’ordre administratif ou technique: gestion de courrier, traitement des commandes, traitement des sinistres en assurance, instruction des demandes de prêts dans les banques, etc.

Les finalités principales d’un logiciel de workflow sont l’ordonnancement et le suivi des travaux au sein d’unités de travail selon des procédures et des règles préétablies. Ce type de logiciel prend en charge de nombreuses tâches ; en particulier, il régule les enchaînements d’opérations, assure la circulation des dossiers à traiter sur les différents postes de travail, surveille les priorités de travaux, gère les délais, assure les synchronisations et déclenche les alertes. Pour toutes ces actions, on établit des liens directs entre les logiciels de workflow et les documents électroniques : ces derniers sont pris en charge par le logiciel de workflow qui, en fonction de règles définies, en assure la distribution sur les postes de travail dans des corbeilles individuelles ou collectives, et prend en charge l’ensemble des déplacements tout au long de la chaîne de travail.

La mise en oeuvre de solution de workflow conduit naturellement à une forte intégration du système de GEIDE au système d’information de l’entreprise. En effet, pour faciliter l’exécution des travaux sur les postes de travail à l’arrivée des documents, on établit des enchaînements automatiques permettant l’accès direct aux applications informatiques, aux outils de production bureautique ; en retour, on facilite la recherche de dossiers électroniques à partir des bases de données de gestion. On est ainsi conduit à définir et à réaliser des postes de travail sur lesquels les différents outils sont intégrés en fonction du métier de l’utilisateur ; l’objectif recherché est l’efficacité de l’utilisateur et la banalisation de l’emploi des différentes techniques, GEIDE en particulier.

Les liens entre documents et outils de groupware sont de même nature, avec comme idée directrice la mise en commun d’un ensemble de dossiers et de documents.

Une mention particulière doit être faite des outils de communication tels que les messageries : elles constituent fréquemment le cadre dans lequel les utilisateurs effectuent entre eux des communications non structurées de documents.

Autre élément indispensable, les logiciels de GED permettent de gérer les accès aux documents en création, mise à jour, lecture et destruction. Ces différents droits sont définis dans les modèles de sécurité propres à chaque entreprise. C’est une des fonctionnalités majeures de l’ensemble des CMS.

Les utilisateurs dans les CMS ont un rôle central et multiple et interviennent dans :

– l’accès au document (lecture, mise à jour, destruction),
– les droits d’auteur (cf. Digital Rights Management – DRM),
– le profil utilisateur (cf. Personnalisation dans les portails d’entreprise) et la personnalisation,
– les compétences, les expertises qui sont rattachées notamment à des personnes, utilisateurs et auteurs, dans les systèmes de gestion de la compétence.

Cette remarque, valable pour l’ensemble de la gestion des applications informatiques, requiert une gestion centralisée et unique des utilisateurs dans des annuaires de type LDAP auxquels doivent pourvoir se connecter les applications de CMS. Il faut envisager par la suite une gestion plus fine et poussée des utilisateurs dans les annuaires de type LDAP pour y faire apparaître l’ensemble des informations importantes concernant l’utilisateur. In fine, les EIP (portails d’entreprise) doivent pouvoir proposer dans leur interface de recherche, une recherche sur les informations utilisateurs contenues dans le(s) annuaire(s) LDAP. On rejoint un peu ici la tentative de Microsoft à travers son « Passeport ». A ce niveau, sont aussi inclues les fonctionnalités d’authentification (signature électronique, certificats).

L’auteur d’un document fait partie des données descriptives d’un document ou encore des méta données d’un document mais est aussi relatif à l’utilisateur.

Les rôles les plus fréquemment retenus dans les flux de travail et d’édition de document sont l’auteur, le correcteur (facultatif) et le validateur (« directeur de publication ») qui autorise ou rejette la publication officielle d’un document. Certains projets nécessitent des flux de travail plus complexes (mise à jour distribuée et/ou parallèlisation des mises à jour et de la validation), notamment pour des projets comprenant plusieurs documents liés les uns aux autres et objets d’organisation et de droits différents. Ces flux sont gérés dans les logiciels de workflow intégrés aux CMS.

Ce chapitre sur la GED nous a permis ainsi d’introduire les fonctionnalités concernant les processus d’édition des documents (workflows), le cycle de vie et l’archivage des documents et les droits d’accès aux documents. Elles sont indispensables aux systèmes de gestion de contenu. On a aussi pu constater l’utilisation obligatoire des méta données dans un système de GED. Une fonctionnalité, mise en avant par la GED et souvent attendue, est le versioning. Les autres fonctionnalités sont plus spécifiques de la numérisation ou de la sécurité des données.

Lire le mémoire complet ==> (Les systèmes de gestion de contenu : description, classification et évaluation)
Mémoire présenté en vue d’obtenir le DIPLOME D’INGENIEUR C.N.A.M. en informatique
Conservatoire National Des Arts Et Métiers – Paris