Guillaume Mazières
Sylvie Guillemin-Lanne
|
Mots clefs |
Terminologie d’Entreprise, communication, cohérence |
|
Fournisseur de la solution |
Temis-Group |
|
Client |
DaimlerChrysler AG |
Les grands groupes automobiles doivent produire et maintenir une
documentation technique dans de nombreuses langues. Ils doivent l’adapter à
différents environnements réglementaires, répondre rapidement aux conditions
sans cesse changeantes du marché, ainsi qu’aux attentes des consommateurs.
Aujourd’hui, la
production de cette documentation technique est rendue complexe du fait de la
mondialisation. Pour qu’elle se réalise dans les meilleures conditions, elle
doit s’appuyer sur un composant indispensable : une terminologie
d’entreprise cohérente.
La mise en place d’une telle terminologie d’entreprise a nécessité
l’exploration d’un fonds documentaire multi-sources, contenant des millions de
termes candidats.
Le processus de construction de terminologie aurait requis un budget
considérable et induit des délais importants s’il n’avait pas été possible de
l’automatiser, en facilitant la construction de cette terminologie
d’entreprise.
Quelle que soit la pièce, le véhicule ou encore le process industriel que décrit un document, il faut s’assurer que le rédacteur et le lecteur auront la même compréhension de chaque terme utilisé. L’utilisation d’une terminologie confuse engendre des coûts élevés de traduction ainsi que des problèmes d’incompréhension, qui peuvent avoir des effets négatifs sur la communication interne et externe.
La solution TAL, intervient dès
l’exploration des fonds collectés. Le TAL permet de procéder à l’analyse
morpho-syntaxique des corpus et, d’extraire de ceux-ci des termes candidats.
La solution de création de
terminologie s’appuie sur un moteur linguistique multilingue qui enchaîne les étapes
linguistiques suivantes :
·
L’identification de la langue,
·
la lemmatisation,
·
l’analyse morphologique,
·
la désambiguïsation morpho-syntaxique
·
l’extraction d’entités
Il est disponible en 12 langues (anglais, allemand, espagnol, français, grec, hongrois, italien, néerlandais, polonais, portugais, russe, tchèque).
- D’un point de vue qualitatif :
o Créer une terminologie d’entreprise homogène et cohérente
o Bénéficier d’une grande qualité de service
- D’un point de vue quantitatif :
o Diminuer les temps de traitement,
o Réduire l’effort manuel à son minimum
Il a été fourni une solution TAL de création de terminologie d’entreprise
en récupérant des données existantes. La construction de la base terminologique
a été réalisée à l’aide du moteur d’analyse linguistique multilingue. De
grosses volumétries de sources clients ont été explorées afin de proposer des
termes candidats et, partant, de construire un thésaurus multilingue cohérent.
Installation / Utilisation
La solution implémentée présente une chaîne de traitement qui prend en
entrée les données existantes du client quel que soit leur format d’origine
(base de données, Excel, texte, etc.) et procède à une série de contrôles par
des experts et de consolidations afin de réduire le nombre de termes candidats
de plusieurs millions à quelques dizaines de milliers et de les présenter dans
un format consolidé et vérifié.
Les différents contrôles et consolidations ont pu être effectués grâce
aux technologies linguistiques telles que l’analyse morpho-syntaxique
multilingue des données fournies en entrée. Les langues impliquées sont
l’anglais, l’allemand, le français, l’italien, l’espagnol et le portugais.
Analyse morpho-syntaxique, extraction de groupes nominaux, extraction
de terminologie multilingue,
Le traitement manuel n’était d’évidence pas une solution réaliste : considérant que la vérification manuelle des différents champs associés à un terme candidat peut prendre jusqu’à 20mn ou plus par terme. Ceci doit être multiplié par le nombre de termes candidats à traiter, soit un plus de 20 moi.
Par ailleurs, l’automatisation du processus de constitution de terminologie a permis de d’affiner la méthodologie de traitement des données existantes, les règles d’extraction automatique pouvant être revues et corrigées après chaque étape, afin que le résultat final, la représentation cible des données existantes, soit conforme aux souhaits.
Nouvelles fonctionnalités fournies par l’outil :
Etiquetage des termes extraits (genre, nombre, …)
Gains opérationnels :
·
Rapidité d’exécution : La solution développée peut traiter
plusieurs centaines de milliers de termes par heure. Elle réalise des contrôles
et des modifications qui nécessiteraient plusieurs mois d’un traitement manuel attentif.
·
Amélioration
de la qualité des documents et de la cohérence des traductions : cette
terminologie partagée par l’ensemble du groupe assure une rédaction cohérente,
indispensable à la bonne compréhension des lecteurs.
·
Traduction
plus rapide : L’utilisation d’une terminologie validée facilite les travaux de
traduction car celle-ci accroît la fréquence de réutilisation des passages déjà
traduits.
·
Réduction
globale des coûts et des délais d’introduction des produits sur le
marché : Une terminologie d’entreprise cohérente réduit le risque de
rappels de documentation liés à des problèmes de rédaction ou de traduction.
Une documentation précise et rapidement disponible participe à la réduction des
délais de mise sur le marché des véhicules.
“Il nous est apparu évident que, vu le volume de données que nous
avions à prendre en considération, un processus d’automatisation était
indispensable. Ce projet nous a permis de réduire l’effort manuel à son minimum
et de bénéficier d’une qualité de service incomparable.”