Nouvelles sources d’information, la modélisation (datamining)

By 22 June 2012

1. le marketing prédictif d’hier à aujourd’hui

1.1Quelles sont les nouvelles sources d’information ?
1.2La modélisation de ces informations : le datamining
1.3Les principales utilisations et applications
1.4L’état du marché et les perspectives

1.1 Quelles sont les nouvelles sources d’information ?

1.1.1 Les différentes sources d’information

Internet a instauré un nouveau mode de collecte d’informations sur les clients : jeux concours, enquêtes de satisfaction, demandes d’information pour l’ouverture d’un compte… Les entreprises ne cessent de rivaliser d’idées pour récolter le plus d’informations possibles et pouvoir ainsi avoir des bases de données clients importantes.

Ainsi l’exemple de Danone est intéressant : la société a lancé son programme « Le bingo des marques » il y a quelques années. Le concept était simple : il s’agissait d’une grille qu’on devait remplir en y collant les différents codes barres des produits Danone achetés. La grille était répartie par catégorie et pour gagner un cadeau ou un chèque (jusqu’à 500 francs) il fallait remplir une grille entièrement. Ce programme a permis à Danone de collecter un certain nombre d’informations sur ses clients (goûts et habitudes) et qui lui permettent actuellement de piloter 20% de ses meilleurs clients. Le programme qui fonctionnait bien, a aujourd’hui changé et il a été remplacé par « Danone et vous : 90 ans, l’anniversaire de Danone » qui permet de remporter des bons de réduction ainsi que des chèques de 1000 euros.

Le social media (1) a fait naître une nouvelle vision de la récolte de données sur Internet. En effet, chaque internaute s’inscrivant sur un site de social media se crée un profil « virtuel » qui donne de très nombreuses informations sur sa profession, sa vie privée, … et il le fait de manière autonome. Ainsi des milliards de données sont stockées par des sites qui peuvent par la suite les exploiter.

Facebook va même jusqu’à proposer des publicités ciblées sur son site. Si un annonceur ne souhaite cibler que les jeunes entre 18 et 25 ans qui habitent en région parisienne et qui sont en école de commerce cela est désormais possible. Récemment, des étudiants du MIT ont développé une expérience dénommée Gaydar qui utilise les techniques du data mining afin de déterminer les caractéristiques d’une personne (positionnement politique, religion et orientation sexuelle) en se basant sur ses amis. L’expérience se base sur le fait que des amis sont sensés partager ses caractéristiques.

Le social media ne se limite pas à Facebook, MySpace, Linkedin, … il s’oriente aussi vers le communautaire et les contenus générés par les internautes. Ainsi, selon une étude IPSOS « Quel est le pouvoir économique des blogs en Europe ? », 35% des internautes français font confiance aux avis lus sur Internet pour le choix d’un produit et 44% n’ont pas concrétisé un achat à cause d’un commentairelu sur Internet. Ces chiffres sont éloquents et nous montrent bien qu’aujourd’hui, Internet joue un rôle important dans nos actes d’achats.

Source : Etude Ipsos sur le pouvoir des blogs en Europe

Les informations recueillies sur Internet permettent ainsi aux entreprises d’analyser les données dans différents buts :

– Enrichir sa connaissance du marché : de nombreuses sociétés proposent aujourd’hui d’analyser votre réputation sur Internet, de décrypter les tendances ou encore d’analyser la concurrence. Avec Internet, tout devient plus simple (les informations en grand nombre sont plus faciles à obtenir et sont rapides d’accès, …) et les informations recueillies permettent de mesurer la réputation et l’intérêt portés par les internautes à une marque.

– Nourrir la communication de la marque : Internet permet aussi d’analyser l’aspect marketing d’une marque, de savoir si telle ou telle campagne a bien fonctionnée sans attendre de très longs mois. Ainsi les avis des internautes permettent d’enrichir les contenus tels que les FAQ, les fiches produits, …

– Apporter des améliorations produits grâce aux avis des internautes. Le cas s’est produit avec l’Oréal qui, après avoir lancé un mascara aux Etats-Unis, a reçu de nombreuses critiques concernant l’odeur du produit :lors de son lancement en Europe, l’odeur désagréable a été supprimé. Les marques peuvent ainsi s’appuyer sur les avis des internautes pour sans cesse améliorer leurs produits. C’est ainsi le cas de Danone qui avait mis en place un vote (via un site Internet : http://nouvelledanette.com/) qui visait à élire le prochain parfum lancé par la marque en 2009.

– Réagir à chaud aux problèmes. Ce point s’avère très important car grâce à Internet, les marques n’ont plus besoin d’attendre le lancement d’un communiqué de presse ou d’un message du PDG. Elle peut ainsi éviter rapidement les débordements.

Les instituts de sondage, tels que Médiamétrie et Ipsos, permettent aussi aux entreprises de récolter des informations précieuses sur les consommateurs : audience de sites Internet, équipement des ménages en nouvelles technologies, …

Ainsi, à l’heure actuelle de très nombreux types d’information peuvent être récoltés sur Internet : aussi bien les informations concernant la vie privée (nombres d’enfants, orientation sexuelle, logement, habitude de consommation, …) que celles concernant la vie professionnelle (poste occupé, niveau de salaire, …). Toutes ces informations permettent aux marques de profiler leurs clients.

1.1.2. Comment exploiter l’information ?

Aujourd’hui, l’information est surtout exploitée à des fins commerciales dans le marketing. Comme expliqué plus haut, le marketing prédictif permet d’analyser un très grand nombre d’information et de sortir des règles qui leur sont applicables.Pour s ‘assurer de bon résultats, il est important, préalablement au recueil et l’exploitation de ces informations, de définir précisément les objectifs de ce analyses.

Un exemple intéressant de l’exploitation de données est la SNCF. Celle-ci a créé en 2004 une filiale nommée CRM services qui permet d’optimiser le marketing à destination des possesseurs de cartes de fidélité : Grand voyageurs et « Gagnez à voyager » (cartes 12-25, Escapades, Senior et Enfant+) ce qui représente un peu plus de trois millions et demi de clients.

Ainsi, la SNCF fait du scoring sur ses clients mais aussi de la segmentation et établit les profils clients. Le programme d’analyse prédictive permet aussi à la SNCF de savoir quel client va ou non utiliser ses points de fidélité et d’adapter le prix des cartes en fonction de leur segmentation et de leur fidélité. Ce système permet réellement de proposer aux clients la meilleure offre et de faire de l’animation commerciale qui peut aussi passer par les SMS.

Le programme a remporté un grand succès puisque le nombre de renouvellement de cartes a augmenté de 15% et la satisfaction client a gagné 5 points en trois ans.

1.2 La modélisation de ces informations : le datamining

1.2.1 Définition du datamining et son évolution

« Le data miningest l’ensemble des algorithmes et méthodes destinés à l’exploration et l’analyse de grandes bases de données informatiques en vue de détecter dans ces données des règles, des associations, des tendances inconnues (non fixées a priori), des structures particulières restituant de façon concise l’essentiel de l’information utile pour l’aide à la décision. »

Source : http://data.mining.free.fr/

Le terme de « data mining » remonte aux années 1989 au cours du premier workshop KDD (KnowledgeDiscovery in Databases). En effet, avant le data mining, les analystes devaient développer des hypothèses sur les données qui étaient par la suite testées sur les bases de données. Mais ce procédé ne fonctionne que dans le cadre d’un volume dedonnées.

Il a donc fallu trouver un moyen de stocker et analyser un grand nombre de données bien plus rapidement via l’ordinateur : le data mining était né. Cependant, le data mining est différent des analyses statistiques car il ne se base pas sur une hypothèse mais analyse les données sans à priori pour tirer des conclusions.

Avec l’évolution rapide des techniques informatiques, les possibilités de stockages de plus en plus importantes et le développement de l’intelligence artificielle, le data mining aide aujourd’hui de très nombreux secteurs à prendre des décisions.

Il s’utilise dans de nombreux domaines très divers même s’il concerne principalement les secteurs qui possèdent de très nombreuses informations clients :
– Les assurances
– Les services financiers
– La grande distribution
– La téléphonie
– Les outils de collaboration.

Il est très utilisé dans le marketing et plus particulièrement dans le CRM car il permet, entre autres, de segmenter des bases de données, d’identifier les clients à risque ou ceux à fort potentiel…

1.2.2 Le principe

Les deux types de techniques du datamining sont les suivantes :

– Les techniques descriptives permettent de souligner ou tirer des règles des informations cachées dans la masse. L’analyse factorielle, le clusteringou la recherche d’association sont des exemples de techniques descriptives. Elles permettent de faire de la segmentation.

– Les techniques prédictives permettent d’extrapoler de nouvelles données à partir des informations recueillies. On distingue deux types de données à extraire :
* Les arbres de décision, l’analyse discriminante ou la régression logistique qui permettent de trouver des données qualitatives.
* La régression linéaire ou les arbres de décision qui permettent de trouver des données quantitatives.

Ces techniques permettent de faire du scoring.

Pour plus d’informations, voir l’annexe 1 : datamining – classification des techniques.

Lire le mémoire complet ==> (Marketing prédictif pour le m-commerce, Quelles opportunités?)
Mémoire de fin d’étude – E-business et mobilité
MBA E-Business