Classification automatique

Guillaume Mazières

Sylvie Guillemin-Lanne

 

Mots clefs

Text Mining, Classification automatique, Plan de classement, Verbatims clients

 

Fournisseur de la solution

Temis-Group

Client

PSA Peugeot Citroën

 

 

 

Contexte, Cas Entreprise

 

Les constructeurs automobiles surveillent de près la qualité perçue par leurs clients en recueillant, par le biais d’enquêtes, leurs sentiments sur les véhicules qu’ils viennent d’acquérir. Les propriétaires de nouveaux modèles sont contactés systématiquement 3 mois après leur acquisition. Ces enquêtes sont l’occasion pour les constructeurs de collecter des informations qualitatives et stratégiques.

 

Description du besoin métier

 

Le Département Qualité, responsable des enquêtes, est chargé de fournir des résultats pertinents et organisés aux différentes entités du groupe intervenant tant au niveau de la production qu’au niveau de la conception.

 

Afin d’exploiter les questions ouvertes des enquêtes de satisfaction, le client recherchait des outils d’analyse afin de :

-          automatiser la classification des verbatims clients

-          obtenir une vision synthétique et structurée qui fasse ressortir les points critiques du ressenti client.

 

Description du processus actuel / chaîne de traitement

 

Jusqu’à ce jour, l’affectation des verbatims clients dans les plans de classement se faisait manuellement, chaque métier possédant son propre plan de classement.

 

Analyse

 

Identification du point d'intervention TAL

 

La solution TAL, intervient dès la phase d’analyse des verbatims. Elle procède, à un premier niveau, à une analyse textuelle de tous les verbatims afin d’extraire de ceux-ci les informations nécessaires à la catégorisation. La solution développée intègre, à un second niveau, des technologies de text-mining :

-          La classification automatique utilisée en pré-traitement explore automatiquement le contenu des verbatims.

-          La catégorisation automatique permet, de classer les verbatims.

 

Description de la technologie TAL applicable

 

La solution développée met en œuvre :

-          un serveur d’analyse linguistique pour procéder à l’analyse morpho-syntaxique des verbatims (tagging, lemmatisation) et en identifier le ou les thèmes abordés.

-          un serveur de classification automatique pour procéder à l’analyse typologique des verbatims existants : en explorer le contenu et en proposer une cartographie sous forme de classes.

-          Un serveur de catégorisation automatique de documents pour classer les verbatims suivant les plans de classement définis, après un apprentissage sur un lot de verbatims représentatif.

 

Description du gain qualitatif / quantitatif attendu

 

-          D’un point de vue qualitatif :

o        Analyse plus rapide et plus précise des retours clients

o        Amélioration de la classification des verbatims

o        Mise en évidence plus rapide des points critiques exprimés dans les verbatims

 

-          D’un point de vue quantitatif :

o        Diminution du temps de traitement des enquêtes qualité.

 

Déploiement et mise en œuvre

 

Évolution de la chaîne de traitement

 

Pour atteindre ces objectifs, il a été développé une application TAL qui repose sur le couplage d’une solution de clustering (organisation automatique de documents) et de catégorisation automatisée.

-          Le serveur de classification a pu organiser un ensemble non structuré de verbatims en une véritable typologie des problèmes rencontrés. Il a ainsi permis d’optimiser le plan de classement initial de l’entreprise en proposant, sur la base de groupes de 300 à 5000 verbatims, 80 plans de classement comportant chacun une dizaine de catégories. Les experts métiers sont ensuite intervenus pour valider ces plans de classement.

-          Le serveur de catégorisation est ensuite utilisé pour affecter automatiquement les nouveaux verbatims clients dans ces 80 plans de classement, après un apprentissage à partir d’un jeu de verbatims témoin.

 

Utilisation

 

Aujourd’hui, l’application fonctionne en temps réel et concerne 400 utilisateurs des métiers de la qualité, de la conception et de la production. Les enquêtes ainsi analysées sont directement intégrées dans l’entrepôt de données du client. La simplicité d’utilisation est une des clés de la réussite de ce projet d’intégration d’outils de text-mining.

 

Description du traitement TAL appliqué

 

Analyse morpho-syntaxique, classification automatique par modèle d’apprentissage

 

 

 

 

 

 

 

 

 

 

Évaluation ROI

 

Coûts et délais de mise en œuvre

 

 

Gains fonctionnels / opérationnels

 

Nouvelles fonctionnalités fournies par l’outil :

-          Existence d’un module de clustering innovant

-          Classement automatique de grands volumes de verbatims clients

 

Gains opérationnels :

o        Gain de temps : diminution du temps de traitement des enquêtes qualité. Les utilisateurs reçoivent instantanément des informations représentatives de la qualité perçue et classées par métier,

o        Amélioration de la connaissance client : les métiers de la conception et de la production ont un accès direct aux ressentis clients relatifs à leur domaine respectif,

o        Gain de qualité : excellente précision de la catégorisation, traduite par une grande fiabilité de l’affectation des verbatims dans les plans de classement.

 

Retours Utilisateurs

 

-          Qualité de l’analyse linguistique qui permet d’atteindre une grande précision dans la catégorisation,

-          Facilité d’intégration d’un vocabulaire métier spécifique à l’industrie automobile.