Études & Publications
À propos de SYSTRAN
Depuis sa création en 1968, SYSTRAN est pionnier dans le domaine des technologies de traduction automatique. Les innovations développées par SYSTRAN sont désormais couramment utilisées par les entreprises et utilisateurs professionnels. Avec une forte orientation vers la recherche et le développement, SYSTRAN, 50 ans plus tard, est plus innovante que jamais.
SYSTRAN propose aux utilisateurs professionnels des solutions de traduction automatisée avancées et sécurisées dans divers domaines tels que la collaboration à l'international, la production de contenu multilingue, le support client, l'eDiscovery, l'analyse de Big Data, le e-commerce, etc. SYSTRAN propose une solution sur-mesure avec une architecture ouverte et évolutive qui permet une intégration transparente dans les applications tierces existantes et les infrastructures informatiques.
Rosetta-LSF : un corpus aligné de la langue des signes française et du français pour la traduction de texte en signe
Rosetta-LSF : un corpus aligné de la langue des signes française et du français pour la traduction de texte en signe
Elise Bertin-Lemée, Annelies Braffort, Camille Challant, Claire Danet, Boris Dauriac, Michael Filhol, Emmanuella Martinod, Jérémie Segouat.
13e Conférence sur les ressources linguistiques et l'évaluation (LREC 2022), juin 2022, Marseille, France.Génération conjointe de sous-titres et de légendes avec double décodage
Génération conjointe de sous-titres et de légendes avec double décodageÀ mesure que la quantité de contenu audiovisuel augmente, la nécessité de développer des solutions de sous-titrage et de sous-titrage automatiques pour répondre aux attentes d'un public international croissant apparaît comme la seule façon viable d'augmenter le débit et de réduire les coûts de postproduction connexes. Le sous-titrage et le sous-titrage automatiques doivent souvent être étroitement liés pour atteindre un niveau approprié... Suite
Compte rendu de la 19e Conférence internationale sur la traduction orale (IWSLT 2022), mai 2022, Dublin, Irlande
SYSTRAN @ WMT 2021 : Tâche terminologique
SYSTRAN @ WMT 2021 : Tâche terminologiqueCet article décrit les soumissions SYSTRAN à la tâche partagée de terminologie WMT 2021. Nous participons à la direction de la traduction de l'anglais vers le français avec un réseau de traduction automatique neuronale Transformer standard que nous améliorons avec la capacité d'inclure dynamiquement des contraintes terminologiques, une pratique industrielle très courante. Deux méthodes d'insertion terminologique de pointe sont évaluées... Suite
MinhQuang Pham, Antoine Senellart, Dan Berrebbi, Josep Crego, Jean Senellart
Compte rendu de la sixième Conférence sur la traduction automatique (WMT), en ligne, 10-11 novembre 2021Révision de la traduction automatique multidomaine
Révision de la traduction automatique multidomaineLors de la construction de systèmes de traduction automatique, il est souvent nécessaire de tirer le meilleur parti des ensembles hétérogènes de données parallèles en formation, et de gérer de manière robuste les entrées provenant de domaines inattendus lors des tests. Ce scénario à domaines multiples a attiré beaucoup de travaux récents qui s'inscrivent dans le cadre général de l'apprentissage par transfert. Dans cette étude, nous revoyons... Suite
MinhQuang Pham, Josep Maria Crego, François Yvon
Transactions de l'Association for Computational Linguistics 9: 17-35, 1er février 2021Intégration de la terminologie de domaine dans la traduction automatique neuronale
Intégration de la terminologie de domaine dans la traduction automatique neuronaleCet article étend les travaux existants sur l'intégration terminologique à la traduction automatique neuronale, une pratique industrielle courante pour adapter dynamiquement la traduction à un domaine spécifique. Notre méthode, basée sur l'utilisation d'espaces réservés complétés par l'annotation morphosyntaxique, puise efficacement dans la capacité du réseau neuronal à gérer les connaissances symboliques pour dépasser la généralisation de surface... Suite
Elise Michon, Josep Maria Crego, Jean Senellart
Compte rendu de la 28e Conférence internationale sur la linguistique informatique, décembre 2020Étude des adaptateurs résiduels pour la traduction automatique neuronale multidomaine
Étude des adaptateurs résiduels pour la traduction automatique neuronale multidomaineL'adaptation de domaine est un problème ancien et frustrant pour les systèmes de traduction automatique. L'approche la plus courante et la plus efficace en matière d'adaptation supervisée consiste à peaufiner un système de base à l'aide de données parallèles dans le domaine. Un réglage fin standard modifie cependant tous les paramètres du réseau, ce qui rend cette approche coûteuse en calcul et sujette au surajustement. Une approche récente et légère augmente plutôt ... Suite
MinhQuang Pham, Josep Maria Crego, François Yvon, Jean Senellart
Compte rendu de la cinquième Conférence sur la traduction automatique, novembre 2020Amorçage De La Traduction Neuronale Automatique
Amorçage De La Traduction Neuronale AutomatiqueL'amorçage est un phénomène de psychologie bien connu et étudié basé sur la présentation préalable d'un stimulus (signal) pour influencer le traitement d'une réponse. Dans cet article, nous proposons un cadre pour imiter le processus d'amorçage dans le contexte de la traduction automatique neuronale (NMT). Nous évaluons l'effet de l'utilisation de traductions similaires comme ... Suite
MinhQuang Pham, Jitao Xu, Josep Maria Crego, François Yvon, Jean Senellart
Compte rendu de la cinquième Conférence sur la traduction automatique, novembre 2020Traduction automatique neuronale efficace et de haute qualité avec OpenNMT
Traduction automatique neuronale efficace et de haute qualité avec OpenNMTCet article décrit les soumissions OpenNMT à la tâche partagée d'efficacité WNGT 2020. Nous explorons la formation et l'accélération de modèles Transformer de différentes tailles qui sont formés dans une configuration enseignant-étudiant. Nous présentons également un moteur d'inférence C++ personnalisé et optimisé qui permet un décodage CPU et GPU rapide avec peu de dépendances. En combinant des optimisations supplémentaires... Suite
Guillaume Klein, Dakun Zhang, Clément Chouteau, Josep Crego, Jean Senellart
Compte rendu du quatrième atelier sur la génération et la traduction neuronales, pages 211 à 217, Association for Computational Linguistics, juillet 2020Stimuler la traduction automatique neuronale avec des traductions similaires
Stimuler la traduction automatique neuronale avec des traductions similairesCette présentation montre des méthodes d'augmentation des données pour Neural Machine Translation afin d'utiliser des traductions similaires, d'une manière comparable à un traducteur humain qui utilise des correspondances floues. Nous montrons comment nous alimentons simplement le modèle neuronal avec des informations sur les côtés source et cible des correspondances floues, et nous étendons également la similarité pour inclure... Suite
Jitao Xu, Josep Crego, Jean Senellart
Compte rendu de la sixième Conférence sur la traduction automatique (WMT), en ligne, 10-11 novembre 2021Incorporation de mots génériques et spécialisés pour la traduction automatique multidomaine
Incorporation de mots génériques et spécialisés pour la traduction automatique multidomaineLa traduction automatique supervisée fonctionne bien lorsque les données de train et d'essai sont échantillonnées à partir de la même distribution. Lorsque ce n'est pas le cas, les techniques d'adaptation permettent de s'assurer que les connaissances acquises à partir de textes hors domaine se généralisent aux phrases dans le domaine. Nous étudions ici un cadre connexe, l'adaptation multi-domaines, où le nombre de domaines est potentiellement grand et... Suite
Minh Quang Pham, Josep Crego, François Yvon, Jean Senellart
Livre : « International Workshop on Spoken Language Translation », « Proceedings of the 16th International Workshop on Spoken Language Translation (IWSLT) », novembre 2019, Hong-Kong, Chine