Édition hypermédia de documents et Web comme espace d’édition

By 11 March 2013

3.5 Édition hypermédia

Le troisième type d’usage constructif d’après notre étude est la mise en place de contenus textuels sur le Web. Bien qu’à l’heure actuelle le service le plus répandu sur Internet reste l’e-mail, il y a bien d’autres applications textuelles, tels les forums de discussion, les systèmes de publication, les chats, les blogs, les wikis, les MUD (Multi-user domain), etc. Cependant, dans cette partie, nous voulons nous concentrer sur les usages qui émergent d’une pratique éditoriale. Dans ce sens, l’édition hypermédia devra être comprise comme la composition du texte à l’écran associée à la publication de contenus accessibles depuis une adresse URL. Pour nous, l’édition hypermédia constitue un usage constructif complémentaire de l’argumentation ou de la modélisation dans le sens où un auteur réalise des tâches de traitement du texte à l’aide des systèmes appropriés pour préparer des documents.

3.5.1 Édition de documents

Du point de vue des systèmes informatiques, la préparation de documents implique deux tâches : l’édition et le formatage [FUR 82]. La première concerne la définition du contenu et de la structure d’un document, et en ce sens, peut s’associer à des tâches argumentatives, tandis que la deuxième est en rapport avec la génération d’un document à partir de spécifications d’affichage, et se réfère donc à la mise en page.

Comme nous l’avons vu, ces tâches peuvent être représentées sous format graphique, mais elles peuvent aussi être des représentations mentales. Afin d’éviter la confusion de termes, nous préciserons que l’argumentation en rapport à l’édition hypermédia est plutôt associée à ce qui Robert Horn a nommé « écriture structurée » [HOR 98], qui est une stratégie pour découper des documents en blocs d’informations

Techniquement, un document est un objet composé de hiérarchies d’objets plus basiques nommés composants du document dont les sections, les paragraphes, les titres, les notes de bas de page, les tableaux, les listes, les équations, les figures et les caractères. Furuta, Scofield et Shaw classifient ces composants en objets abstraits (les caractères, les mots) et en objets concrets (les espaces blancs). Ainsi, l’exécution d’opérations pour définir, manipuler, et afficher des objets abstraits et concrets est nommée traitement de documents [FUR 82].

Le développement de systèmes permettant de traiter des documents a débouché sur deux grands types d’outils. Ceux qui se spécialisent dans le formatage et compilent l’affichage de documents à partir de spécifications de l’architexte [§ 4.3.1] (document compilers, par exemple des compilateurs LaTeX); et ceux qui intègrent dans un même outil le formatage, l’édition et l’affichage (document interpreters ou interactive formatters, par exemple des éditeurs de texte WYSIWYG 391) et qui permettent à l’usager de manipuler la représentation exacte d’un document tel qui sera perçu par les utilisateurs finals.

391 WYSIWYG est l’acronyme de l’anglais What You See Is What You Get.

Il est facile à apercevoir que la préparation de documents est en rapport avec l’écriture topographique de Bolter, dont l’un de concepts clés est la granularité de composants pour articuler un système de repérages aisément identifiable par les usagers.

3.5.2 Le Web comme espace d’édition

On parle du « Web scriptural » (writable Web) pour faire référence à la possibilité d’écrire des contenus Web avec les mêmes outils que nous disposons pour les lire [DIL 05]. Dans cette direction, une grande majorité de développements se sont penchés sur la réalisation d’outils basés sur le langage HTML afin de permettre l’édition hypermédia directement depuis un navigateur Web conventionnel. Les milieux les plus favorisés ont toujours été le scientifique, l’éducatif et le journalistique. Néanmoins, depuis peu, la parution des blogs et des wikis ont attiré des nouveaux usagers vers l’édition hypermédia. Dans les deux cas, nous constatons que l’une de principales préoccupations a été le formatage de textes sur le Web. Les approches de cette problématique ont essayé d’y répondre soit par le biais de « métaphores de masquage » de balises HTML, soit par l’intégration des éditeurs HTML user-friendly.

3.5.2.1 Formatage du texte sur le Web

Sur le Web, on dit souvent que la lingua franca est le langage HTML (Hypertext Markup Language), qui permet de formater le texte et de mettre en place tout autre objet média pouvant être affiché sur un navigateur. Les standards les plus récents du W3C, HTML 4.01 (publié en 1999) et XHTML 1.0 (révisé en 2002), proposent plus de 80 éléments pour la mise en page sur le Web et peuvent se diviser en éléments de bloc et en éléments incorporés pour identifier les composants d’un document.

D’une part, les éléments de bloc portent la caractéristique d’ajouter une nouvelle ligne dans le flux de texte d’un document, c’est-à-dire qu’ils gèrent les objets concrets. Dans la pratique, les éléments de bloc peuvent contenir des caractères, des éléments incorporés et d’autres éléments de bloc. Des exemples d’éléments de bloc sont les balises : blockquote, center, div, fieldset, form, h1, hr, ol, ul, p, pre, table, etc.

D’autre part, les éléments incorporés continuent le flux de texte sans insérer des nouvelles lignes. Dans la plupart des cas, les éléments incorporés sont utilisés pour donner un style spécifique à une chaîne de caractères, par exemple les balises a, code, em, small, big, strong, sub, sup, etc. Toutefois, ils peuvent contenir d’autres éléments incorporés, mais rarement un élément de bloc. Parmi ces balises nous trouvons : button, img, input, iframe, object, small, span, textarea, etc.

Par analogie aux éditeurs de texte, les outils sur le Web s’appuient sur le langage HTML pour proposer des interfaces graphiques d’édition de documents. En effet, grâce aux éléments d’entrée comme les formulaires, les usagers ont la possibilité de saisir du texte à l’écran. Ces outils vont de la capture du texte simple (un champ de saisi normal) jusqu’à son formatage complexe (un outil WYSIWYG), en passant par des interfaces qui proposent des syntaxes pour substituer les balises HTML (techniques de masquage, par exemple **gras** à la place de gras pour dénoter gras).

3.5.2.2 Édition hypermédia à des fins pédagogiques

L’édition hypermédia à des fins pédagogiques est souvent considérée comme une fonction comprise au sein de Learning Management Systems [§ 1.3.3]. Même si ces systèmes ont suivi plutôt une approche de gestion de ressources, on y trouve de plus en plus des outils permettant d’éditer des contenus textuels. Dans ce sens, des systèmes modernes commerciaux et open source intègrent dans la plupart de cas un éditeur HTML du type WYSIWYG pour formater le contenu d’un cours, des activités, des exercices…

Mais peut-être qu’un vrai usage éditorial du Web s’observe aussi du côté des apprenants. Récemment nous avons constaté les avantages de l’emploi des blogs et des wikis comme outils pédagogiques, surtout dans l’enseignement à distance. En effet, la grande variété des outils et des services disponibles donne accès à chaque étudiant pour créer son espace personnel où il publie ses devoirs, gère le développement des projets en équipe, fait des contributions aux autres étudiants ²

392 Les exemples ici mentionnés ont été choisis d’après notre expérience personnelle en tant que tuteur au sein de la formation à distance Licence en Webmestre Éditorial à l’Université Paris V René Descartes. Nous citons tout de même les travaux d’Augar, Raitman et Zhou [AUG 04] à propos de l’usage éducatif de wikis et de blogs.

3.5.2.3 Contraintes de l’édition hypermédia basée sur HTML

Bien que le langage HTML réponde aux besoins du grand public dans la mesure où il constitue un langage puissant et universellement reconnu pour l’édition hypermédia, son approche reste essentiellement statique et très liée au formatage.

Comme nous l’avons observé au cours de l’évolution de systèmes hypermédias, plusieurs technologies Web sont apparues aussitôt pour constituer le HTML dynamique (DHTML), qui permet, entre autres, la communication avec la couche d’informations et la manipulation interactive des objets à l’écran (indispensable pour l’argumentation hypermédia et la modélisation).

Mais les contraintes majeures du domaine documentaire ne résident peut-être pas seulement dans l’affichage d’un document ou dans les fonctionnalités dynamiques. La communauté documentaire a fortement reproché au HTML sa pauvre distinction entre style et contenu, et surtout l’absence d’une structuration sémantique à la fois stricte et adaptable selon les besoins. Malgré tout, n’oublions pas que HTML fut conçu à l’origine par des spécialistes en documents structurés et que c’est avec l’introduction du standard CSS (Cascade Style Sheets) en 1996 qu’un premier effort vers la séparation du style et contenu a été fait.

393 De fait, le DTD (Document Type Definition) de HTML sous format SGML a été publié en 1992.

394 Depuis la version HTML 4.0 (1997), plusieurs balises ayant des fonctions purement stylistiques ont été désapprouvées, tels que font, s, strike, u, etc. Au contraire, les attributs class et name ont été introduits.

Quant au problème de la structuration, l’arrivée du XML (Extensible Markup Language), et sa galaxie de technologies satellites, a proposé des nouvelles façons de rapprocher l’édition hypermédia du Web sémantique. Désormais, plusieurs travaux sont conduits en vue d’une séparation non seulement du style et de contenu, mais aussi de la structure et des éléments dynamiques. La recommandation XHTML du W3C est un exemple de codage strict des documents HTML auquel peuvent s’ajouter des noms d’espace appartenant à d’autres recommandations plus sémantiques, tel que RDF (Resource Description Framework), ou plus dynamiques, tel que SMIL (Synchronized Multmedia Intergation Language).

Objet technique hypermédia : repenser la création de contenu éducatif sur le Web
Thèse pour obtenir le grade de Docteur – Discipline: Sciences de l’information et de la communication
Université De Paris VIII – VINCENNES-SAINT-DENIS – U.F.R. Langage Informatique Technologie