논문 및 간행물

About Systran

번역 기술 분야에서 55년 이상의 경험을 쌓은 SYSTRAN은 최초의 웹 기반 번역 포털 및 기업 및 공공 기관을 위한 인공 지능과 신경망을 결합한 최초의 신경 번역 엔진을 포함하여 이 분야에서 최고의 혁신을 개척했습니다.

SYSTRAN은 비즈니스 사용자에게 글로벌 협업, 다국어 콘텐츠 제작, 고객 지원, 전자 조사, 빅 데이터 분석, 전자 상거래 등 다양한 영역에서 고급 및 안전한 자동 번역 솔루션을 제공합니다. SYSTRAN은 기존의 타사 애플리케이션과 IT 인프라에 원활하게 통합할 수 있는 개방적이고 확장 가능한 아키텍처를 갖춘 맞춤형 솔루션을 제공합니다.

다중 레벤슈틴 트랜스포머가 있는 예제 기반 NMT를 향해

Maxime Bouthors, Josep Crego, François Yvon.

2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023), 2023년 12월, 싱가포르.

BiSync: 동기화된 단일 언어 텍스트를 위한 이중 언어 편집기

세계화 시대에 하나 또는 다국어의 외국어로 의사소통을 해야 하는 상황이 점점 더 많이 발생하고 있습니다. 서면으로 커뮤니케이션하는 경우, 외국어를 잘 구사하는 사용자는 컴퓨터 지원 번역(CAT) 기술의 도움을 받을 수 있습니다. 이러한 기술을 통해 사용자는 종종 다음과 같은 외부 리소스에 액세스할 수 있습니다. 계속보기...

Josep Crego, Jitao Xu, François Yvon.

제61회 계산 언어학 협회 연례 회의(ACL 2023), 2023년 7월, 캐나다 토론토

텍스트에서 수화의 계층적 표현으로의 예제 기반 기계 번역

이 백서에서는 텍스트에서 수어(SL)로 자동 번역하는 실험을 소개합니다. 대규모의 정렬된 말뭉치가 없기 때문에 계층적 표현의 형태로 수어 담화를 중간적으로 표현하는 AZee를 사용하여 예제 기반 접근 방식을 탐색했습니다.

Élise Bertin-Lemée, Annelies Braffort, Camille Challant, Claire Danet, Michael Filhol

18e Conférence en Recherche d'Information et Applications — 16e Renconférence Jeunes Chercheurs en RI — 30e Conférence sur le Traitement Automatique des Langues Naturelles — 25e Rencontre des Étudiants Chercheures en Informatique pour le Traitement Automatique des Langues (TALN 2023), 2023년 6월, 프랑스 파리.

번역 메모리를 비자동 진행 기계 번역에 통합하기

Jitao Xu, Josep Crego, François Yvon.

제7차 계산 언어학 협회 유럽 지부 컨퍼런스(EACL 2023), 계산 언어학 협회, 2023년 5월, 크로아티아 두브로브니크.

이중 언어 동기화: 편집 작업을 사용하여 번역 관계 복원

기계 번역(MT)은 일반적으로 일부 소스 텍스트에 해당하는 대상 언어를 처음부터 생성하는 원샷 프로세스로 간주됩니다. 여기서는 소스의 유효한 번역으로 변환하여 소스와 타깃 간의 병렬성을 복원해야 하는 초기 타깃 시퀀스를 가정하는 보다 일반적인 설정을 고려합니다. 이 이중 언어 동기화 작업을 위해 여러 아키텍처(자동 회귀 및 비자동 회귀 모두)와 훈련 체제를 고려하고 시뮬레이션된 대화형 MT, 번역 메모리(TM)를 사용한 번역 및 TM 정리와 같은 여러 가지 실제 설정을 실험해 보았습니다. 그 결과, 하나의 일반 편집 기반 시스템이 미세 조정을 거치면 이러한 작업을 위해 특별히 훈련된 전용 시스템과 비슷하거나 더 나은 성능을 발휘할 수 있음을 알 수 있었습니다.

Jitao Xu, Josep Crego, François Yvon

2022 자연어 처리의 경험적 방법에 관한 컨퍼런스(EMNLP 2022), 2022년 12월, 아랍에미리트 아부다비, 아랍에미리트연합

번역 메모리가 있는 비자동 회귀 기계 번역

비자동 회귀 기계 번역(NAT)은 최근 큰 발전을 이루었습니다. 그러나 현재까지 대부분의 작업은 표준 번역 작업에 중점을 두어 왔으며, Levenshtein Transformer(LevT)와 같은 일부 편집 기반 NAT 모델은 번역 메모리(TM)를 사용한 번역에 적합해 보임에도 불구하고 말입니다. 여기서는 이러한 시나리오를 고려합니다. 먼저 바닐라 LevT 모델을 분석합니다. 계속보기...

Jitao Xu, Josep Crego, François Yvon

2022년 자연어 처리 경험적 방법에 관한 회의(EMNLP 2022), 2022년 12월, 아랍에미리트 아부 다비

프랑스어 라이브 음성 대본의 강력한 번역

직접 접근 방식과의 성능 격차가 좁혀졌음에도 불구하고 자동 음성 인식(ASR)과 기계 번역(MT)을 포함하는 캐스케이드 솔루션은 여전히 음성 번역(ST)에 주로 사용되고 있습니다. 입력 음성 신호를 번역하기 위해 단일 모델을 사용하는 직접 접근 방식은 데이터 부족이라는 심각한 병목 현상을 겪습니다. 또한 여러 산업 애플리케이션에서 음성 트랜스크립트를 표시하는 ... 계속보기...

Elise Bertin-Lemée, Guillaume Klein, Josep Crego, Jean Senellart

제15회 미주 기계 번역 협회 격년제 컨퍼런스(2권: 사용자 및 제공업체 트랙 및 정부 트랙), 2022년 9월 미국 올랜도, 자료집

다국어 및 다중 도메인 기계 번역을 위한 잠재 그룹 드롭아웃

다중 도메인 및 다국어 기계 번역은 종종 매개변수 공유 전략에 의존하는데, 네트워크의 큰 부분은 당면한 작업의 공통점을 포착하기 위한 것이고 작은 부분은 언어나 도메인의 특성을 모델링하기 위해 예약되어 있는 것입니다. 어댑터 기반 접근 방식에서는 이러한 전략이 네트워크 아키텍처에 하드코딩되어 독립적으로 ... 계속보기...

Minh-Quang Pham, François Yvon, Josep Crego

컴퓨터 언어학 협회의 연구 결과: NAACL 2022, 2022년 7월, 미국 시애틀, 미국

계층적 표현에서 예제 기반 다선형 수화 생성.

Boris Dauriac, Annelies Braffort, Elise Bertin-Lemée.

2022년 6월, 프랑스 마르세유.

동적 샘플링 전략을 사용한 신경망 기계 번역의 다중 도메인 적응

효과적인 신경망 기계 번역 모델을 구축한다는 것은 종종 관심 있는 도메인에 대한 성능을 최적화하기 위해 다양한 이질적인 데이터 세트를 수용하는 것을 의미합니다. 이러한 다중 소스/다중 도메인 적응 문제는 일반적으로 작업과 관련된 학습 인스턴스의 관련성에 대한 정적 평가를 기반으로 인스턴스 선택 또는 가중치 재조정 전략을 통해 접근합니다. 계속보기...

MinhQuang Pham, Antoine Senellart, Dan Berrebbi, Josep Crego, Jean Senellart

제23차 유럽 기계 번역 협회 연례 회의록 , 2022년 6월, 벨기에 겐트, 벨기에