논문 및 간행물
About Systran
번역 기술 분야에서 55년 이상의 경험을 쌓은 SYSTRAN은 최초의 웹 기반 번역 포털 및 기업 및 공공 기관을 위한 인공 지능과 신경망을 결합한 최초의 신경 번역 엔진을 포함하여 이 분야에서 최고의 혁신을 개척했습니다.
SYSTRAN은 비즈니스 사용자에게 글로벌 협업, 다국어 콘텐츠 제작, 고객 지원, 전자 조사, 빅 데이터 분석, 전자 상거래 등 다양한 영역에서 고급 및 안전한 자동 번역 솔루션을 제공합니다. SYSTRAN은 기존의 타사 애플리케이션과 IT 인프라에 원활하게 통합할 수 있는 개방적이고 확장 가능한 아키텍처를 갖춘 맞춤형 솔루션을 제공합니다.
데이터-텍스트 생성을 위한 향상된 변환기 모델
데이터-텍스트 생성을 위한 향상된 변환기 모델신경 모델들은 최근 데이터베이스 기록들을 기초로 하여 기술 텍스트들이 생성되는 데이터-텍스트 생성 태스크들에서 상당한 진전을 보여주었다. 본 연구에서는 콘텐츠 선택 및 요약 생성을 엔드 투 엔드 방식으로 학습하는 새로운 트랜스포머 기반 데이터-텍스트 생성 모델을 제시한다. 우리는 기준 변압기 모델에 두 가지 확장을 도입합니다. 먼저, 우리는 수정합니다. 계속보기...
리공, 조세프 크레고, 장세넬라르
Book: Proceedings of the 3rd Workshop on Neural Generation and Translation, pages 148-156, Association for Computational Linguistics, 2019년 11월, 홍콩, 중국SYSTRAN @ WAT 2019: 러시아-일본 뉴스 해설 작업
SYSTRAN @ WAT 2019: 러시아-일본 뉴스 해설 작업이 문서에서는 WAT 2019 러시아-일본 뉴스 해설 작업에 대한 Systran{'s 제출물에 대해 설명합니다. 사용 가능한 리소스가 매우 적고 언어 쌍의 거리가 멀기 때문에 어려운 번역 작업입니다. 우리는 제공된 자원에 대해 학습된 신경 변압기 아키텍처를 사용했으며, 이를 완화하는 것을 목표로 합성 데이터 생성 실험을 수행했다. 계속보기...
Jitao Xu, TuAnh Nguyen, MinhQuang Pham, Josep Crego , Jean Senellart
제6회 아시아 번역 워크숍 진행, 페이지 189-194, 계산 언어학 협회, 2019년 11월, 홍콩, 중국SYSTRAN @ WNGT 2019: DGT 작업
SYSTRAN @ WNGT 2019: DGT 작업이 문서에서는 SYSTRAN이 신경망 생성 및 번역(WNGT 2019) 3차 워크샵의 DGT(Document-level Generation and Translation) 공유 작업에 참여하는 것에 대해 설명합니다. 수정된 입력 임베딩으로 향상된 트랜스포머 네트워크를 사용하고 콘텐츠 선택을 고려하는 추가 목적 함수를 최적화하는 데 처음으로 참여한다. 네트워크는 구조화된 ... 계속보기...
리공, 조세프 크레고, 장세넬라르
Proceedings of the 3rd Workshop on Neural Generation and Translation, pages 262-267, Association for Computational Linguistics, 2019년 11월, 홍콩, 중국병렬 코퍼스 필터링에 대한 WMT2018 공유 작업에 대한 SYSTRAN 참여
병렬 코퍼스 필터링에 대한 WMT2018 공유 작업에 대한 SYSTRAN 참여본 논문은 제3차 기계 번역 컨퍼런스(WMT 2018)에서 병렬 코퍼스 필터링에 대한 공유 작업에 대한 SYSTRAN의 참여에 대해 설명한다. 우리는 다국어 문맥에서 문장 쌍의 관련성을 예측하는 것을 목표로 하는 신경 문장 유사성 분류기를 사용하여 처음으로 참여한다. 그 신문은 주요 특징들을 설명하고 있다... 계속보기...
Minh Quang Pham, Josep Crego, Jean Senellart
기계 번역에 대한 세 번째 회의 (WMT18), 10월 31 - 2018년 11월 1일, 브뤼셀, 벨기에Neural MT를 위한 병렬 코포라의 변환 발산 고정
Neural MT를 위한 병렬 코포라의 변환 발산 고정기계 번역에 대한 코퍼스 기반 접근법은 깨끗한 병렬 코퍼스의 가용성에 의존한다. 그러한 자원은 부족하고, 그들의 준비와 관련된 자동 프로세스 때문에, 종종 시끄럽다. %는 기대했던 것만큼 평행하지 않은 문장 쌍들을 포함할 수 있다. 이 문서에서는 번역 발산을 감지하는 감독되지 않은 방법에 대해 설명한다. 계속보기...
Minh Quang Pham, Josep Crego, Jean Senellart, 프랑수아 이본
2018 Conference on Empirical Methods in Natural Language Processing, 10월 31일 - 11월 4일, 브뤼셀, 벨기에신경 기계 번역에서 지식 증류 분석
신경 기계 번역에서 지식 증류 분석지식 증류는 최근 신경 기계 번역에 성공적으로 적용되고 있다. 기본적으로 축소된 네트워크를 구축할 수 있으며 결과적으로 생성된 시스템은 원본 모델의 품질을 대부분 유지합니다. 많은 저자가 지식 증류의 이점에 대해 보고했음에도 불구하고, 특히 맥락에서 그것이 작동하는 실제 이유를 논의하는 작품은 거의 없다. 계속보기...
다쿤 장, 조세프 크레고, 장 세넬라르
15th International Workshop on Spoken Language Translation, 10월 29-30 2018, 브뤼헤, 벨기에WNMT 2018용 OpenNMT 시스템 설명: 싱글 코어 CPU에서 800워드/초
WNMT 2018용 OpenNMT 시스템 설명: 싱글 코어 CPU에서 800워드/초우리는 WNMT 2018 평가를 위한 OpenNMT 신경 기계 번역 엔트리에 대한 시스템 설명을 제시한다. 본 연구에서는 고성능 CPU 시스템을 대상으로 고도로 최적화된 NMT 추론 모델을 개발하였다. 최종 시스템은 4가지 기술의 조합을 사용하며, 이들 모두는 조합된 상당한 속도 증가를 초래한다: (a) 서열 증류, (b) ... 계속보기...
Jean Senellart, Dakun Zhang, Bo Wang, Guillaume Klein, J.P. Ramatchandirin, Josep Crego, Alexander M. Rush
"Proceedings of the 2nd Workshop on Neural Machine Translation and Generation", pages 122-128, Association for Computational Linguistics, 2018년 7월 20일, 호주 멜버른아랍어 사투리 식별을 위한 신경망 아키텍처
아랍어 사투리 식별을 위한 신경망 아키텍처SYSTRAN은 올해 처음으로 아랍어 방언 식별 하위 작업으로 DSL 공유 작업에 참여합니다. 우리는 학습에 사용할 수 있는 학습 데이터의 양이 제한적임에도 불구하고 경쟁력 있는 결과를 얻을 수 있음을 보여주는 여러 신경망 모델을 훈련시켜 참여한다. 우리는 우리의 실험을 보고하고 네트워크 아키텍처와 매개 변수를 자세히 설명합니다 ... 계속보기...
엘리스 미촌, 민꽝팜, 조셉 크레고, 장 세넬라트
"유사한 언어, 종류 및 방언에 대한 NLP에 대한 제 5 워크숍 절차"에 게시됨, 계산 언어학 협회, 페이지 128-136, 2018 년 8 월 20 일, 뉴멕시코 , 미국Boosting Neural 기계 번역 [PDF]
Boosting Neural 기계 번역 [PDF]트레이닝 효율성은 NMT(Neural Machine Translation)의 주요 문제 중 하나이다. 딥 네트워크는 최첨단 성능을 달성하기 위해 매우 큰 데이터뿐만 아니라 많은 훈련 반복이 필요하다. 이는 매우 높은 연산 비용을 초래하여 연구 및 산업화를 둔화시킨다. 이 논문에서는 몇 가지 훈련 방법으로 이 문제를 완화할 것을 제안한다. 계속보기...
다쿤 장, 김중기, 조셉 크레고, 장 세넬라트
"제8차 자연어 처리 국제 공동 회의 회의 회람"(2권: 단편 논문), 아시아 자연어 처리 연맹, 2017, 타이베이, 대만OpenNMT: 신경 기계 번역을 위한 오픈 소스 툴킷 [PDF]
OpenNMT: 신경 기계 번역을 위한 오픈 소스 툴킷 [PDF]NMT(Neural Machine Translation)를 위한 오픈 소스 툴킷에 대해 설명합니다. 이 툴킷은 효율성, 모듈성 및 확장성에 우선 순위를 두고 모델 아키텍처, 특징 표현 및 소스 모달리티에 대한 NMT 연구를 지원하는 동시에 경쟁력 있는 성능과 합리적인 교육 요구 사항을 유지합니다. 이 툴킷은 모델링 및 번역 지원과 함께 ...에 대한 자세한 교육학 설명서로 구성됩니다. 계속보기...
기욤 클라인, 윤김, 윤톈 뎅, 장 세넬라트, 알렉산더 러쉬
"Proceedings of ACL 2017, System Demonstrations", pages 67-72, Association for Computational Linguistics, 2017, Vancouver, Canada에 게시됨