Guillaume Mazières
Sylvie Guillemin-Lanne
|
Mots clefs |
Text Mining, Classification automatique, Plan de classement, Verbatims
clients |
|
Fournisseur de la solution |
Temis-Group |
|
Client |
PSA Peugeot Citroën |
Les constructeurs automobiles
surveillent de près la qualité perçue par leurs clients en recueillant, par le
biais d’enquêtes, leurs sentiments sur les véhicules qu’ils viennent
d’acquérir. Les propriétaires de nouveaux modèles sont contactés
systématiquement 3 mois après leur acquisition. Ces enquêtes sont l’occasion
pour les constructeurs de collecter des informations qualitatives et
stratégiques.
Le Département Qualité, responsable des
enquêtes, est chargé de fournir des résultats pertinents et organisés aux
différentes entités du groupe intervenant tant au niveau de la production qu’au
niveau de la conception.
Afin d’exploiter les questions ouvertes
des enquêtes de satisfaction, le client recherchait des outils d’analyse afin
de :
-
automatiser la classification des verbatims
clients
-
obtenir une vision synthétique et structurée
qui fasse ressortir les points critiques du ressenti client.
Jusqu’à ce jour, l’affectation des
verbatims clients dans les plans de classement se faisait manuellement, chaque
métier possédant son propre plan de classement.
La solution TAL, intervient dès la
phase d’analyse des verbatims. Elle procède, à un premier niveau, à une
analyse textuelle de tous les verbatims afin d’extraire de ceux-ci les
informations nécessaires à la catégorisation. La
solution développée intègre, à un second niveau, des technologies de
text-mining :
-
La classification automatique utilisée en
pré-traitement explore automatiquement le contenu des verbatims.
-
La catégorisation automatique permet, de
classer les verbatims.
La solution développée met en œuvre :
-
un serveur d’analyse linguistique pour procéder à
l’analyse morpho-syntaxique des verbatims (tagging, lemmatisation) et en
identifier le ou les thèmes abordés.
-
un serveur de classification automatique pour procéder à
l’analyse typologique des verbatims existants : en explorer le contenu et
en proposer une cartographie sous forme de classes.
-
Un serveur de catégorisation automatique de documents pour
classer les verbatims suivant les plans de classement définis, après un apprentissage sur un lot de verbatims
représentatif.
- D’un point de vue qualitatif :
o Analyse plus rapide et plus précise des retours clients
o Amélioration de la classification des verbatims
o Mise en évidence plus rapide des points critiques exprimés dans les verbatims
- D’un point de vue quantitatif :
o
Diminution du temps de traitement des enquêtes qualité.
Pour atteindre ces objectifs, il a été
développé une application TAL qui repose sur le couplage d’une solution de
clustering (organisation automatique de documents) et de catégorisation
automatisée.
-
Le
serveur de classification a pu organiser un ensemble non structuré de verbatims
en une véritable typologie des problèmes rencontrés. Il a ainsi permis
d’optimiser le plan de classement initial de l’entreprise en proposant, sur la
base de groupes de 300 à 5000 verbatims, 80 plans de classement comportant
chacun une dizaine de catégories. Les experts métiers sont ensuite intervenus
pour valider ces plans de classement.
-
Le
serveur de catégorisation est ensuite utilisé pour affecter automatiquement les
nouveaux verbatims clients dans ces 80 plans de classement, après un
apprentissage à partir d’un jeu de verbatims témoin.
Utilisation
Aujourd’hui, l’application
fonctionne en temps réel et concerne 400 utilisateurs des métiers de la
qualité, de la conception et de la production. Les enquêtes ainsi analysées
sont directement intégrées dans l’entrepôt de données du client. La simplicité d’utilisation est une des clés de la réussite de ce
projet d’intégration d’outils de text-mining.
Analyse morpho-syntaxique, classification automatique par modèle
d’apprentissage

Nouvelles fonctionnalités fournies par l’outil :
-
Existence d’un module de clustering innovant
- Classement automatique de grands volumes de verbatims clients
Gains opérationnels :
o
Gain
de temps : diminution du temps de traitement des enquêtes qualité. Les
utilisateurs reçoivent instantanément des informations représentatives de la
qualité perçue et classées par métier,
o
Amélioration
de la connaissance client : les métiers de la conception et de la production
ont un accès direct aux ressentis clients relatifs à leur domaine respectif,
o
Gain
de qualité : excellente précision de la catégorisation, traduite par une grande
fiabilité de l’affectation des verbatims dans les plans de classement.
-
Qualité
de l’analyse linguistique qui permet d’atteindre une grande précision dans la
catégorisation,
-
Facilité
d’intégration d’un vocabulaire métier spécifique à l’industrie automobile.