TADEEP: Traducción automática en profundidad // Itzulpengintza automatiko sakona

Kalitatezko Itzulpen Automatikoa (IA) jarraitzen zuen erronka izaten 2015ean. Enpresa erabiltzaileek eta erabiltzaile partikularrek ezagun zituzten IAren abantailak eta bazekiten zeintzuk ziren erabileraren mugak. Enpresek produktibitatea handitu nahi zuten, IAko erremintak eta postedizio-inguruneak konbinatuz. Partikularrek intentsiboki zerabiltzen IAa nahiz eta hark eskaintzen zuen kalitatea beti ez izan lortu nahi zutena. IXA taldeak TACARDI eta QTLeap proiektuetako emaitzetan oinarrituta artearen egoera hobetuko zuten tekniketan ikertzea proposatzen zuen bi alderditan:
(1) Analisi sakonean eta ikasketa sakonean oinarritutako IA. "word embedding" eta "deep-learning" bidez.
(2). Domeinu espezifikoetan egokitutako IA. Domeinu baterako egindako egokitze on bat kalitate-hobekuntzarako berme onenetako bat da: QTLeap proiektuko informatikako domeinu teknikoetan komertzialki interesgarriak diren hobekuntzak lor zitezkeen, baita TACARDI proiektuko sare sozialetan ere, edo gaurkotasun handiko domeinu medikoan edo kontsumokoan.

http://ixa2.si.ehu.es/tadeep/eu/node/1

Deskribapena (en): 

(http://ixa2.si.ehu.es/tadeep/)
In 2015, high quality machine translation (MT) was still a challenge. Users, whether companies or individuals, were currently aware of the benefits and limitations of these systems. Whereas companies focused on increasing productivity by combining translation memories, CAT tools and post-editing environments, regular users used MT systems extensively even when the quality did not reach the desired level.

Based on our previous work and results in the TACARDI project (MINECO-lTIN2012-38523-C02-01) and the QTLeap European project (FP7-ICT-2013.4.1-610516), we proposed to investigate techniques that improve the state of the art of MT systems by focusing on two important aspects:

(1) Deep analysis and Deep NLP. Neural networks and their application through "word embedding" and "deep-learning" had revolutionized the area of NLP in the last three years.

(2) Domain-specific MT. Given their current level of output quality, appropriate domain adaptation was the best guarantee for quality improvement: technical domains, such as the IT domain explored in the QTLeap project, social networks explored in the TACARDI project, or other highly topical domains such as the medical domain or services can achieve improvements of commercial value.

The working languages of the project were mainly English, Spanish and Basque. The first two avail of large quantities of information to exploit during research and they have high possibilities to reach the market. Basque, in turn, poses a research challenge given its rich morphology, free word order and fewer available resources, which presents an ideal set-up to explore the generalisability of the project's outcomes to other language pairs.

The IXA group at UPV/EHU had the know-how and experience required to undertake this project. The group did not only include experts in MT but also experts in morphology, syntax, semantics and machine learning.

Deskribapena (es): 

(http://ixa2.si.ehu.es/tadeep/)
La traducción automática (TA) de calidad sigue siendo un reto en 2015.Las empresas usuarias y los usuarios particulares se han familiarizado con las ventajas y limitaciones de su uso. Mientras las primeras focalizan en aumentar la productividad, combinando las memorias de traducción, las herramientas de TA y los entornos de postedición; los segundos la usan intensivamente aunque no siempre les ofrece la calidad que quisieran. El Grupo Ixa Apoyándose en los trabajos y resultados del proyecto previo TACARDI y de nuestra actualparticipación en el proyecto europeo QTLeap propuso investigar en técnicas que mejoren el estado del arte en sistemas de TA en dos aspectos: (1) TA basada en análisis profundo y en aprendizaje en profundidad. En el área del PLN ha habido una revolución con la irrupción de las redes neuronales y su aplicación por medio del word embedding y deep-learning. (2) TA adaptada a dominios específicos. Dadas las limitaciones de calidad de los sistemas de TA, una buena adaptación al dominio es una de las mejores garantías de mejora de la calidad: en dominios técnicos como el de informática del proyecto QTLeap, las redes socialesdel proyecto TACARDI u otros de gran actualidad como el dominio médico y el de consumo se pueden conseguir mejoras que seaninteresantes comercialmente.

Deskribapena (fr): 
(http://ixa2.si.ehu.es/tadeep/) La qualité de la traduction automatique (TA) demeure un défi en 2015. Les entreprises utilisatrices et les utilisateurs privés ont pris conscience des avantages et des limites de son utilisation. Alors que les premiers se concentrent sur l'augmentation de la productivité en combinant les mémoires de traduction, les outils de TA et les environnements de post-édition, les seconds l'utilisent de manière intensive bien qu'elle ne leur offre pas toujours la qualité qu'ils souhaiteraient. En s'appuyant sur les travaux et les résultats du projet TACARDI précédent et sur notre participation actuelle au projet européen QTLeap, le groupe Ixa a proposé des recherches sur les techniques qui améliorent l'état de l'art des systèmes de TA à deux égards : (1) AT basé sur une analyse approfondie et un apprentissage approfondi. Dans le domaine PLN, il y a eu une révolution avec l'irruption des réseaux neuronaux et leur application par l'intégration de mots et l'apprentissage profond. (2) AT adaptée à des domaines spécifiques. Compte tenu des limites de qualité des systèmes d'AT, une bonne adaptation au domaine est l'une des meilleures garanties d'amélioration de la qualité : dans des domaines techniques tels que le projet informatique QTLeap, les réseaux sociaux du projet TACARDI ou d'autres domaines très actuels tels que les domaines médical et celui du consomme, des améliorations commercialement intéressantes peuvent être réalisées.
Izena (gaztelania): 
TADEEP: Traducción automática en profundidad
Izena (ingelesa): 
TADEEP: Deep Machine Translation
Kode ofiziala: 
TIN2015-70214-P
Ikertzaile nagusia: 
Kepa Sarasola
Erakundea: 
MINECO -FEDER
Hasiera data: 
2016/01/01
Bukaera data: 
2018/12/31
Taldeko ikertzaile nagusia: 
Kepa Sarasola
Besteak: 
Lluis Marquez (Qatar Computing Research Institute)
Kontratua: 
No