Études & Publications

recherche par icône

À propos de SYSTRAN

Depuis sa création en 1968, SYSTRAN est pionnier dans le domaine des technologies de traduction automatique. Les innovations développées par SYSTRAN sont désormais couramment utilisées par les entreprises et utilisateurs professionnels. Avec une forte orientation vers la recherche et le développement, SYSTRAN, 50 ans plus tard, est plus innovante que jamais.

SYSTRAN propose aux utilisateurs professionnels des solutions de traduction automatisée avancées et sécurisées dans divers domaines tels que la collaboration à l'international, la production de contenu multilingue, le support client, l'eDiscovery, l'analyse de Big Data, le e-commerce, etc. SYSTRAN propose une solution sur-mesure avec une architecture ouverte et évolutive qui permet une intégration transparente dans les applications tierces existantes et les infrastructures informatiques.

Rosetta-LSF : un corpus aligné de la langue des signes française et du français pour la traduction de texte en signe

Rosetta-LSF : un corpus aligné de la langue des signes française et du français pour la traduction de texte en signe

Elise Bertin-Lemée, Annelies Braffort, Camille Challant, Claire Danet, Boris Dauriac, Michael Filhol, Emmanuella Martinod, Jérémie Segouat.

13e Conférence sur les ressources linguistiques et l'évaluation (LREC 2022), juin 2022, Marseille, France.

Génération conjointe de sous-titres et de légendes avec double décodage

Génération conjointe de sous-titres et de légendes avec double décodage

À mesure que la quantité de contenu audiovisuel augmente, la nécessité de développer des solutions de sous-titrage et de sous-titrage automatiques pour répondre aux attentes d'un public international croissant apparaît comme la seule façon viable d'augmenter le débit et de réduire les coûts de postproduction connexes. Le sous-titrage et le sous-titrage automatiques doivent souvent être étroitement liés pour atteindre un niveau approprié... Suite

Compte rendu de la 19e Conférence internationale sur la traduction orale (IWSLT 2022), mai 2022, Dublin, Irlande

SYSTRAN @ WMT 2021 : Tâche terminologique

SYSTRAN @ WMT 2021 : Tâche terminologique

Cet article décrit les soumissions SYSTRAN à la tâche partagée de terminologie WMT 2021. Nous participons à la direction de la traduction de l'anglais vers le français avec un réseau de traduction automatique neuronale Transformer standard que nous améliorons avec la capacité d'inclure dynamiquement des contraintes terminologiques, une pratique industrielle très courante. Deux méthodes d'insertion terminologique de pointe sont évaluées... Suite

MinhQuang Pham, Antoine Senellart, Dan Berrebbi, Josep Crego, Jean Senellart

Compte rendu de la sixième Conférence sur la traduction automatique (WMT), en ligne, 10-11 novembre 2021

Révision de la traduction automatique multidomaine

Révision de la traduction automatique multidomaine

Lors de la construction de systèmes de traduction automatique, il est souvent nécessaire de tirer le meilleur parti des ensembles hétérogènes de données parallèles en formation, et de gérer de manière robuste les entrées provenant de domaines inattendus lors des tests. Ce scénario à domaines multiples a attiré beaucoup de travaux récents qui s'inscrivent dans le cadre général de l'apprentissage par transfert. Dans cette étude, nous revoyons... Suite

MinhQuang Pham, Josep Maria Crego, François Yvon

Transactions de l'Association for Computational Linguistics 9: 17-35, 1er février 2021

Intégration de la terminologie de domaine dans la traduction automatique neuronale

Intégration de la terminologie de domaine dans la traduction automatique neuronale

Cet article étend les travaux existants sur l'intégration terminologique à la traduction automatique neuronale, une pratique industrielle courante pour adapter dynamiquement la traduction à un domaine spécifique. Notre méthode, basée sur l'utilisation d'espaces réservés complétés par l'annotation morphosyntaxique, puise efficacement dans la capacité du réseau neuronal à gérer les connaissances symboliques pour dépasser la généralisation de surface... Suite

Elise Michon, Josep Maria Crego, Jean Senellart

Compte rendu de la 28e Conférence internationale sur la linguistique informatique, décembre 2020

Étude des adaptateurs résiduels pour la traduction automatique neuronale multidomaine

Étude des adaptateurs résiduels pour la traduction automatique neuronale multidomaine

L'adaptation de domaine est un problème ancien et frustrant pour les systèmes de traduction automatique. L'approche la plus courante et la plus efficace en matière d'adaptation supervisée consiste à peaufiner un système de base à l'aide de données parallèles dans le domaine. Un réglage fin standard modifie cependant tous les paramètres du réseau, ce qui rend cette approche coûteuse en calcul et sujette au surajustement. Une approche récente et légère augmente plutôt ... Suite

MinhQuang Pham, Josep Maria Crego, François Yvon, Jean Senellart

Compte rendu de la cinquième Conférence sur la traduction automatique, novembre 2020

Amorçage De La Traduction Neuronale Automatique

Amorçage De La Traduction Neuronale Automatique

L'amorçage est un phénomène de psychologie bien connu et étudié basé sur la présentation préalable d'un stimulus (signal) pour influencer le traitement d'une réponse. Dans cet article, nous proposons un cadre pour imiter le processus d'amorçage dans le contexte de la traduction automatique neuronale (NMT). Nous évaluons l'effet de l'utilisation de traductions similaires comme ... Suite

MinhQuang Pham, Jitao Xu, Josep Maria Crego, François Yvon, Jean Senellart

Compte rendu de la cinquième Conférence sur la traduction automatique, novembre 2020

Traduction automatique neuronale efficace et de haute qualité avec OpenNMT

Traduction automatique neuronale efficace et de haute qualité avec OpenNMT

Cet article décrit les soumissions OpenNMT à la tâche partagée d'efficacité WNGT 2020. Nous explorons la formation et l'accélération de modèles Transformer de différentes tailles qui sont formés dans une configuration enseignant-étudiant. Nous présentons également un moteur d'inférence C++ personnalisé et optimisé qui permet un décodage CPU et GPU rapide avec peu de dépendances. En combinant des optimisations supplémentaires... Suite

Guillaume Klein, Dakun Zhang, Clément Chouteau, Josep Crego, Jean Senellart

Compte rendu du quatrième atelier sur la génération et la traduction neuronales, pages 211 à 217, Association for Computational Linguistics, juillet 2020

Stimuler la traduction automatique neuronale avec des traductions similaires

Stimuler la traduction automatique neuronale avec des traductions similaires

Cette présentation montre des méthodes d'augmentation des données pour Neural Machine Translation afin d'utiliser des traductions similaires, d'une manière comparable à un traducteur humain qui utilise des correspondances floues. Nous montrons comment nous alimentons simplement le modèle neuronal avec des informations sur les côtés source et cible des correspondances floues, et nous étendons également la similarité pour inclure... Suite

Jitao Xu, Josep Crego, Jean Senellart

Compte rendu de la sixième Conférence sur la traduction automatique (WMT), en ligne, 10-11 novembre 2021

Incorporation de mots génériques et spécialisés pour la traduction automatique multidomaine

Incorporation de mots génériques et spécialisés pour la traduction automatique multidomaine

La traduction automatique supervisée fonctionne bien lorsque les données de train et d'essai sont échantillonnées à partir de la même distribution. Lorsque ce n'est pas le cas, les techniques d'adaptation permettent de s'assurer que les connaissances acquises à partir de textes hors domaine se généralisent aux phrases dans le domaine. Nous étudions ici un cadre connexe, l'adaptation multi-domaines, où le nombre de domaines est potentiellement grand et... Suite

Minh Quang Pham, Josep Crego, François Yvon, Jean Senellart

Livre : « International Workshop on Spoken Language Translation », « Proceedings of the 16th International Workshop on Spoken Language Translation (IWSLT) », novembre 2019, Hong-Kong, Chine