Tilde MODEL Catalan Corpus

Compartiu

Descripció

El corpus Tilde MODEL conté 3.400.000 segments alineats en català i alemany i l’integren totes les versions del corpus. La versió en català s’ha obtingut mitjançant el servei de traducció automàtica d’Apertium a partir del castellà.

Aquest conjunt de dades es pot fer servir per a entrenar models de traducció automàtica neuronal i s’ha utilitzat en el motor de traducció automàtica de Softcatalà alemany-català.

Adreça de descàrrega:

https://github.com/Softcatala/Tilde-MODEL-catalan
Autors:

Softcatalà

David Cànovas

Jordi Mas

Llicència:

CC-BY 4.0