Contenu éducatif: Langages, Objets pédagogiques et Web sémantique

By 12 March 2013

4.7 Travaux en relation

Notre approche centrée sur les structures n’est pas étrangère à diverses recherches et travaux qui confèrent plus d’importance aux structures qu’aux données dans le processus créatif. Dans cette partie, nous analysons d’autres études en relation avec notre approche tout en montrant les différences de chacune par rapport à notre perspective. Nous nous focalisons spécifiquement sur les langages de structuration, les objets pédagogiques, et le Web sémantique.

4.7.1 Langages de structuration

Depuis la création du langage SGML et de son descendant, le XML, tous les deux publiés et maintenus par le W3C, les langages de structuration se sont démultipliés. Nous avons constaté la tendance récente sur le Web à l’emploi de langages de description basés sur XML pour des domaines spécifiques. Parmi les recommandations W3C, on trouve : XHTML pour le Web; MathML pour les mathématiques; SMIL pour les présentations multimédias; SVG pour les graphiques vectoriels; WML pour le contenu à distribuer sur les appareils mobiles; OWL pour l’élaboration d’ontologies; etc.

Mais d’autres domaines se sont rapidement intéressés à la description de leurs propres langages aussi basés sur le XML. Du côté propriétaire, Microsoft a prévu pour sa suite de logiciels bureautiques Office 2007 le langage Office Open XML (OOXML), un format qui définit un modèle de document pour chacune de ses applications : WordprocessingML pour Word, SpreadsheetML pour Excel ou PresentationML pour PowerPoint. Du côté open source, plusieurs projets ont confié au XML la définition de leur langage d’opération. L’un des travaux les plus représentatifs est DocBook, développé par Oasis.

DocBook est un schéma écrit en plusieurs formats, dont XML Schéma (XSD), qui a l’objectif de définir les éléments constitutifs de livres et d’articles scientifiques. De fait, il s’agit d’un schéma assez robuste et précis. Néanmoins une version simplifiée a été publiée à des fins pratiques.

Comme tout autre document numérique, la production d’un document utilisant la syntaxe de DocBook implique une distinction entre la structure logique et sa représentation graphique. De plus, il peut être transformé à d’autres formats (PDF, RTF, RDF…).

La structure logique de DocBook est composée d’éléments tels que article, title, author, section, para. Par rapport à notre approche, on peut noter que ces éléments constituent une sorte de notation sémantique adapté aux besoins du domaine documentaire. Grâce à cette définition simple d’éléments, le modèle DocBook est largement utilisé et il est inclus par défaut dans plusieurs éditeurs de documents XML.

En suivant les expériences positives d’implémentation de ce modèle, les DPN peuvent être considérés comme une tentative vers la définition d’un modèle adapté aux besoins spécifiques du domaine éducatif. De plus, bien que dans la pratique plusieurs documents DocBook sont transformés vers d’autres formats de documents, l’état actuel du Web nous permet d’augmenter un modèle existant par le biais d’espaces de nommage, à condition de garder le XML comme format natif. De ce point de vue, DocBook peut être incorporé dans un modèle DPN et vice-versa.

4.7.2 Objets pédagogiques

Le concept d’« objet pédagogique » ou « objet d’apprentissage », promulgué par les organismes de standardisation dans le domaine de l’enseignement à distance, se présente comme la monnaie d’échange entre les institutions éducatives qui les élaborent en assurant sept « habilités » : exchangeability, durability, scalability, manageability, discoverability, affordability et adaptability. Cependant, nous avons vu que leur application a souvent négligé la structuration de contenu [§ 1.4.1].

En effet, pour les organismes internationaux, un « objet pédagogique » est, dans sa manière la plus simple, un ensemble de ressources réunies autour d’un document sous format XML qui établit leurs relations. Dans cette optique, une ressource peut être un objet média, un livre numérisé, un document PDF, ou un « document pédagogique numérique ». En effet, en ce qui concerne les objets pédagogiques, notre approche n’a pas l’intention de les supprimer, mais plutôt de les améliorer au niveau de la structuration du contenu, c’est-à-dire d’ajouter une couche sémantique non au niveau des super-structures, mais dans le contenu même des documents, dans le niveau atomique.

Mais la structuration de contenus à ce niveau élémentaire n’est pas nouvelle. Les travaux ont particulièrement été développés au sein des laboratoires de recherche et des universités intéressées pour le traitement de leurs données numériques pédagogiques. Le concept clé est celui d’« objet de connaissance » ou « knowledge object » [KOP 01] qui se distingue de l’« objet pédagogique » dans le sens où il établit les caractéristiques logiques et sémantiques des ressources pédagogiques.

Or, ces travaux peuvent se diviser en langages éducatifs de modélisation et en langages de structuration sémantique des objets pédagogiques. Les premiers sont des modèles de documents dont le but est de définir le contenu au travers de ses fonctions et opérations dans le processus de modélisation de scénarios pédagogiques [RAW 02], tandis que les deuxièmes sont des modèles de documents dont le but est l’analyse, la définition et le design de structures sémantiques pour le contenu textuel des objets pédagogiques [PET 04]. Ces derniers sont centrés sur les aspects éducatifs, alors que les premiers sont orientés vers les aspects techniques [FRI 04].

L’implémentation d’un langage éducatif de modélisation est bien exemplifiée par EML [KOP 01]. Le langage EML (Educational Modelling Language) a été développé à l’Open University of the Netherlands par Rob Koper en 1998. La base d’EML réside dans les « unités d’apprentissage » qui contiennent une série de balises XML. À un premier niveau de la structuration se trouvent les entités : metadata, role, learning objectives, pre-requisites, content et method. À un niveau plus basique de l’élément content, EML permet également de définir la structuration de contenus textuels à partir de balises inspirés du langage HTML. Depuis 2003, EML n’est plus maintenu en raison du fait qu’il a servi comme base à la norme IMS LD.

En ce qui concerne les langages de structuration sémantiques, les premiers travaux ont commencé avec QML (Quiz Markup Language), développé par Bamberger, Shorey et Stimpkinsson à l’université de Washington State aux États-Unis; EduML (Education Markup Language), créé par Bruno Vernier au sein de Seul Educational Projects; SATML (Standardized Assessment and Testing Markup Language), proposé en 1997 par Ferrandez et Eaglin à l’université de Central Florida; et, TML (Tutorial Markup Language), développé par Daniel Brickley à l’université de Bristol en Angleterre.

Bien que ces projets ne soient plus maintenus, d’autres projets sont apparus essayant d’adopter une perspective modulaire et d’interopérabilité avec les recommandations e-learning. Tel est le cas de LMML (Learning Material Markup Language Framework), développé en 1999 par Christian Süß à l’université Passau en Allemagne, de TeachML développé par le groupe Targeteam (TArgeted Reuse and GEneration of TEAching Materials) de la Technischen Universität à Munich, et du projet OLA (Open Learning Agency) dans la British Columbia au Canada.

Malgré ces efforts, le défi reste entier. Dans la plupart de cas, ces modèles répondent aux besoins spécifiques d’un contexte, ou au contraire, sont conçus en termes très généraux afin de faciliter leur emploi. Il reste à ajouter le manque d’études empiriques et surtout l’indisponibilité des outils informatiques d’auteur, notamment sur le Web.

4.7.3 Web sémantique

Le Web sémantique est né en réponse à l’état du Web actuel, qui est conçu pour une lecture par les humains et non pour une manipulation significative par des programmes informatiques. L’idée est d’ajouter une couche permettant l’analyse avancée et automatique de contenus Web. L’objectif est donc de rendre le contenu des ressources Web « interprétables non seulement par l’homme mais aussi par la machine » [BER 01].

Dans le domaine éducatif, l’introduction du Web sémantique n’a pas été une question négligée. Rob Koper [KOP 04] a étudié les possibilités offertes par le Web sémantique en association avec un changement à long terme de l’enseignement dans plusieurs directions :

* une augmentation de l’efficacité de l’éducation;
* une augmentation de la flexibilité et de l’accessibilité de l’éducation;
* une augmentation de l’attrait de l’éducation;
* une réduction du travail réalisé par les enseignants et le personnel de support, ainsi qu’une réduction des coûts de production de matériels pédagogiques.

Plus spécifiquement le rôle du Web sémantique en tant qu’aide aux enseignants est de rendre plus souples et flexibles leurs tâches quotidiennes au travers des environnements en ligne disposant d’un support collaboratif pour la production de cours et le management de fonctions administratives. Pour ce faire, les technologies XML se trouvent une fois de plus au cœur du paradigme.

Dans l’enseignement, comme dans d’autres domaines, le Web sémantique fait appel à l’UML (Unified modeling language), aux schémas XML, aux DTDs, au RDF, aux Topic Maps, à OWL (Web ontology language), à l’analyse sémantique et aux agents informatiques. Koper décrit un cas de l’utilisation d’UML, de RDF et de schémas XML comme cadre pratique pour la modélisation de scénarios pédagogiques avec le langage EML [KOP 04]. Un autre cas est représenté par l’implémentation d’une DTD (Document Type Definition) proposée par Fabrice Papy dans les « réseaux-bases de données » générés par le logiciel HyWebMap afin de les transformer en « documents numériques éducatifs » [PAP 04] adaptables et partageables.

Par rapport au Web sémantique, notre approche s’insère dans une optique d’exploitation de schémas XML en tant que modèles de document évolutifs. Comme il a été évoqué, notre étude ne consiste pas en la génération de réseaux sémantiques ou de super-structures, mais elle essaie de répondre à une problématique de définition de contenus à un degré atomique visant à considérer celui-ci comme socle pour la réalisation d’autres pratiques. Dans un scénario idéal, un modèle de document XML doit être capable d’évoluer selon les besoins sémantiques propres du domaine et, en raison de la nature et de la souplesse du langage, il peut aussi être représenté aussi sous d’autres formats. À cette fin, les transformations à l’aide du XSLT ont une grande importance.

Depuis peu, d’autres pratiques liées au Web sémantique sont envisageables en faisant appel aux « Services Web », dans lesquels une structuration plus fine de contenus permet un meilleur adressage des informations.

Les Services Web définissent une série de protocoles et d’interfaces de programmation pour permettre la communication entre des applications sur le Web. Ils sont souvent considérés comme des applications pouvant être publiées, localisées et invoquées en utilisant l’Internet. Au sein de tout Service Web, c’est la technologie XML qui opère comme langue maternelle et c’est le protocole HTTP qui est l’environnement le plus utilisé pour effectuer les échanges. Néanmoins les protocoles SMTP ou FTP peuvent également être utilisés.

Bien que les approches soient multiples, un aperçu générique des Services Web permet d’observer la manière dont trois technologies XML se mêlent :

* SOAP (Simple Object Access Protocol), pour le transfert de données sous forme de messages et d’enveloppes;
* WSDL (Web Services Description Language), pour la description de services de réseau qui permettent la communication automatique entre les applications;
* UDDL (Universal Description, Discovery, and Integration), pour trouver des fournisseurs de services.

Actuellement, les cadres d’utilisation de Services Web sont essentiellement commerciaux, dans un contexte B2B (Business to business), mais l’architecture de base peut s’adapter à un contexte éducatif. Une discussion sur ce point sera portée plus loin, notons pour l’instant que les technologies XML se présentent effectivement comme la base d’un Web sémantique dans lequel ils jouent leur rôle en tant que structure et contenu des messages et en tant qu’outil pour leur transmission.

4.8 Conclusion

Dans ce chapitre, cela a été notre intention d’introduire une nouvelle approche de la création de contenus éducatifs sur le Web.

Dans un premier temps, nous avons procédé à une extension de la notion de signe afin de clarifier les concepts de contenu et de création. En suivant les investigations de Louis Hjelmslev, nous avons indiqué que les éléments syntaxiques et sémantiques des hypermédias sont des fonctifs associés à une fonction sémiotique, c’est-à-dire qu’ils sont constitués d’un plan d’expression (une balise, une chaîne de caractères, un objet média en général) et d’un plan de contenu (l’intériorisation de la signification dans la pensée de l’individu).

Dans un deuxième temps, cette distinction nous a permis d’observer que, pour faire surgir un sens, les individus effectuent un travail de production sémiotique. Ce travail est matériel parce qu’il a affaire avec des expressions auxquelles l’individu assigne une signification. Mais, à proprement parler, si le travail matériel est une forme de production, il n’est pas toujours pour autant une création. En effet, l’individu utilise les signes par l’intermédiaire de la reconnaissance, de l’ostentation, de la réplique, mais il y a de la création uniquement dans le cas où il invente de nouvelles formes d’expressions et de contenus.

Ces postulats ont été repris dans un cadre éducatif afin de proposer une approche de la création de contenus basée sur des aspects sémantiques, d’un côté, et sur des fonctionnalités des systèmes hypermédias, de l’autre. Notre proposition a été de conférer une attention plus particulière aux règles d’articulation, aux transformations, aux signifiés de ces comportements, enfin à l’éventail de codes hypermédias plutôt qu’à l’information elle-même.

Cette approche a été mise en relation avec le Web. À ce sujet, nous avons signalé que le Web est effectivement un type de média qui dépend fortement du texte pour dénoter et connoter. La place que le texte trouve dans le cyberespace est particulière par rapport aux types d’objets médias dans la mesure où il est le plus représenté et celui qui détermine le fonctionnement du Web.

Or, le fonctionnement du Web semble être en grand partie déterminé par des besoins de formatage, par la création de contenus selon un paradigme de mise en page et par l’ajout de couches semi-sémantiques aux ressources. Nous pensons que, dans ce cadre, la possibilité de réel texte de réseau est réduite ou presque à néant.

Notre intention a été en premier instance d’explorer les capacités d’un type de création visant l’établissement de relations plus adéquates entre expressions et contenus, entre signifiants et signifiés, entre codes pédagogiques et codes hypermédias. La voie pour entamer cette démarche s’est dirigée vers les structures qui constituent les codes hypermédias plutôt que sur les données; cette voie est incarnée par les « documents pédagogiques numériques ».

Les documents pédagogiques numériques reprennent les idées fondamentales de l’établissement d’un contrat de lecture entre enseignants et apprenants. À cette fin, nous nous sommes intéressés à la création d’éléments paratextuels pertinents pour le domaine pédagogique tout en gardant à l’esprit que leur représentation graphique à l’écran va au-delà de la considération de l’écriture au sens restreint, c’est-à-dire en tant que simple enchaînement de caractères alphanumériques. L’écriture, nous l’avons évoqué, est mieux comprise dans un contexte informatisé si l’on prend soin des aspects topographiques : espaces en blanc, hiérarchisation, signes graphiques (symboliques et iconiques), etc.

Un document pédagogique numérique contribue au travail créatif de la production de contenus dans le sens où il permet d’inventer de nouvelles expressions pour dénoter un contenu ainsi que des nouvelles formes de représentation de ces expressions. En vertu du fait que les aspects de format et de forme sont indépendants du contenu, les documents peuvent se distribuer comme un tout ou comme des sous-parties; sous forme de code XML structuré ou sous forme d’hypermédia navigable, taxonomique, spatial, séquentiel…; en reproduisant les conventions du Web 1.0 ou 2.0 ou de toute autre évolution à venir.

Mais afin de déterminer la pertinence de notre projet par rapport à d’autres travaux ayant des relations avec lui, la réalisation d’un système hypermédia supportant les exigences des documents pédagogiques numériques, au moins dans leurs aspects les plus importants, est nécessaire. Dans le chapitre suivant, nous allons présenter un prototype d’outil développé dans le cadre de cette recherche qui nous permettra d’offrir des exemples clairs de notre approche.

Objet technique hypermédia : repenser la création de contenu éducatif sur le Web
Thèse pour obtenir le grade de Docteur – Discipline: Sciences de l’information et de la communication
Université De Paris VIII – VINCENNES-SAINT-DENIS – U.F.R. Langage Informatique Technologie