Optimiser une page Web pour le référencement

By 16 December 2012

2. Optimiser une page Web pour le référencement

La première mission du référencement est d’assurer la présence d’un nombre maximal de pages d’un site sur les outils de recherche.

2.1. Les règles générales de l’optimisation

Un bon positionnement dépend de l’adéquation du code source de la page Web avec les critères de pertinence propres à chaque moteur, lesquels sont connus et faciles à mettre en œuvre (voir supra Chapitre 1, « Méthodes de tri des résultats et ranking », p. 22). Il est dès lors surprenant de constater que seuls 7 % des sites commerciaux sont optimisés pour un référencement [Saporta, 2005, p. 32, (23)].

Outre les préconisations déjà évoquées au Chapitre 1, rappelons que les algorithmes de classement des moteurs de recherche attribuent une pondération supérieure aux 200 premiers caractères d’une page web. Il est donc recommandé d’éviter les pages totalement graphiques [Chu, 2003, p. 97, (03)] et d’utiliser autant que possible les mots dans les titres, les liens, les attributs ALT des images et dans le texte.

Mis à part la balise « meta robots », qui permet d’interdire l’indexation d’une page par les moteurs de recherche et de suivre ou non les liens qu’elle contient, les autres balises meta n’ont plus aucune incidence dans le cadre d’un référencement [Andrieu, 2005, (17)].

Enfin, l’emplacement de la page dans l’arborescence d’un site a également un impact direct sur son référencement : les robots accèdent plus difficilement à une page située dans un sous- répertoire de 5e niveau qu’à une page située à la racine d’un site. En règle générale, il est conseillé de ne pas dépasser plus de trois niveaux d’arborescence [Chu, 2003, p. 100, (03)].

Les démarches de référencement gagnent à être effectuées une fois que le site est finalisé (pas de liens inactifs ni de pages en construction).

2.2. Sélection des mots-clés

Le besoin d’information est un processus cognitif individuel, propre à un utilisateur. Il va influencer sa recherche et sa lecture du document obtenu. Dans ces conditions, comment déterminer la nature des mots-clés que va utiliser l’internaute pour chercher l’information ?

Le choix des mots-clés (mots isolés ou expressions regroupant plusieurs mots) est une étape fondamentale dans le processus de référencement d’un site web. En effet, « chaque combinaison ou mot aura une incidence sur l’optimisation et donc le placement du site et des pages web sur les outils de recherche » [Chu, 2003, p. 98, (03)]. Cette problématique est familière aux documentalistes qui s’interrogent depuis longtemps sur la détermination des termes représentatifs d’un document, leur emploi effectif par les utilisateurs lors de leurs recherches et les moyens d’atténuer le bruit et le silence* des résultats.

2.2.1. Définition

En informatique, le concept de « mot-clé » diverge de son sens documentaire. En effet, il désigne un mot non normalisé, issu du vocabulaire libre, qui se réfère non à l’attribut « Keywords » comme on le croit souvent, mais aux mots du texte. C’est pourquoi, il semble plus judicieux d’employer le terme « descripteur* » ou « vedette-matière » dans le cadre strictement documentaire afin de bien les différencier.

On peut distinguer deux types de mots-clés [Andrieu, 2001, p. 68, (11)] : les mots primaires (ou « larges ») qui définissent le domaine d’intervention (agroalimentaire, informatique, presse, histoire, santé, médecine, etc.) et les mots secondaires (ou « profonds ») plus précis, qui permettent d’approfondir la recherche en fonction des besoins de l’internaute.

2.2.2. Choix des mots-clés

Sur le web, les mots-clés les plus rentables sont ceux qui génèrent du trafic. Deux objectifs doivent donc guider la définition de ces mots : ils doivent refléter le contenu du site et s’adapter à la cible visée. Plus elle est réduite, plus le vocabulaire utilisé sera précis et la liste de mots-clés clairement délimitée. En revanche, si le site concerne un large public, notamment dans le cadre d’un objectif de notoriété, le vocabulaire sera plus général et donc plus approximatif [Saporta, 2005, p. 55, (23) ; Chu, 2003, p. 98, (03)].

Le moyen le plus efficace de choisir les bons mots-clés consiste à se substituer aux internautes effectuant une recherche et à faire preuve d’intuition pour envisager toutes les requêtes susceptibles d’être posées [Chirié, 1995, p. 65, (10) ; Calishain & Dornsfet, 2003, p.340, (05) ; Quatravaux, 2004, p. 249, (32)].

On peut également s’inspirer des indications offertes par les sociétés qui vendent du positionnement publicitaire (AdWords*, Overture) ou encore des nombreux utilitaires disponibles sur Internet – ils permettent d’obtenir, pour un mot-clé, les combinaisons complémentaires pour ce mot ainsi que le nombre de recherches associées16 – dont le site Abondance.com fournit une liste non exhaustive17.

Dans leur ensemble, les auteurs [Le Guelvouit, 1999, p. 129, (33) ; Saporta, 2005, p. 55 et 73, (23)] s’accordent à souligner l’importance, pour une page ou un site Web, de se positionner sur les mots-clés populaires ou familiers et les abréviations, synonymes et anglicismes. Le référenceur doit également profiter des erreurs de frappe et fautes d’orthographe pour se positionner au mieux.

Alors que, pour l’indexation, l’emploi du singulier est recommandé par une norme (NF Z 44-070), dans le cadre d’un référencement, au contraire, il faut prévoir toutes les variantes orthographiques d’un mot (pluriel, singulier, lettres accentuées ou non).

L’indexation vise à faciliter l’accès rapide à l’information. Le référencement a, en sus, une visée marketing. Toutes les variantes d’un même mot, qu’il soit populaire ou mal orthographié, seront clés de recherche pour l’internaute, ce qui est impensable dans le cadre de l’indexation documentaire.

2.3. Facteurs bloquants

De nombreux facteurs peuvent influer sur le référencement d’un site. Le cahier des charges, préalable à toute création, devra prendre en compte ces contraintes.

2.3.1. Les frames

Il s’agit d’un système qui permet d’afficher plusieurs pages indépendantes dans une même fenêtre du navigateur. En général, on utilise les frames pour afficher une zone de menu statique et répétitive alors que le reste de la page est visible dans une zone que l’on fait défiler. La balise n’est pas reconnue par tous les moteurs. Du coup, les robots ne naviguent pas correctement dans le site et n’indexent pas toutes les pages. L’insertion de la balise peut toutefois permettre de résoudre ce désagrément [Chu, 2003, p. 102, (03)].

2.3.2. Flash et Javascript

Flash et Javascript nuisent à l’indexation car ils ne sont pas gérés correctement par les robots. Les informations présentes dans une animation Flash sont ignorées, les liens en JavaScript (pop-up, rollover…) non suivis. Il est préférable de restreindre leur utilisation, de proposer une version sans Flash du site et de doubler les liens graphiques par une version textuelle simple [Chu, 2003, p. 103, (03)].

2.3.3. Les pages dynamiques

Certains moteurs rencontrent des difficultés à indexer les pages dynamiques (voir infra « Le référencement des pages dynamiques », p. 46). Ces dernières sont identifiables à leur URL « exotique »* comprenant des points d’interrogation (?) et esperluettes (&) à l’image de l’adresse ci-dessous :

http://www.lavoisier.fr/fr/livres/index.asp?texte=r%E9f%E9rencement&select=motcle&exact=on&togo=&support=NULL&from=

Parmi les autres facteurs bloquants, citons en vrac : le script CGI en page d’accueil, les pages trop graphiques, les balises ou les redirections réalisées au niveau du DNS (Domain Name Server) et le spamdexing [Andrieu, 2000, p. 248-249, (02)].

Lire le mémoire complet ==> (Référencement : Stratégie documentaire versus Stratégie marketing)
Mémoire pour obtenir le DESS en Sciences de l’information et de la documentation spécialisées
Conservatoire National Des Arts Et Métiers – Institut National Des Techniques De La Documentation