Descripció
El corpus Tilde MODEL conté 3.400.000 segments alineats en català i alemany i l’integren totes les versions del corpus. La versió en català s’ha obtingut mitjançant el servei de traducció automàtica d’Apertium a partir del castellà.
Aquest conjunt de dades es pot fer servir per a entrenar models de traducció automàtica neuronal i s’ha utilitzat en el motor de traducció automàtica de Softcatalà alemany-català.
Adreça de descàrrega:
https://github.com/Softcatala/Tilde-MODEL-catalanAutors:
Softcatalà
David Cànovas
Jordi Mas
Llicència:
property | value | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
name | Catalan-German Tilde MODEL Corpus |
||||||||||||
description | The Tilde MODEL corpus contains data collected from public sector websites and has 3.4 million sentences. It has been translated using Apertium rule-based machine translation system from Spanish to Catalan. This dataset has the German translation aligned and includes all the Tilde MODEL parts. |
||||||||||||
license |
|
||||||||||||
sameAs | https://www.softcatala.org/dades-obertes/tilde-catalan-corpus/ |
||||||||||||
url | https://github.com/Softcatala/Tilde-MODEL-catalan |
||||||||||||
creator |
|