Monolingual Catalan text corpus for Common Voice

Compartiu

Descripció

Aquest recull de frases en català està format per 33.000 segments sense etiquetar. Una de les aplicacions més important és el projecte Common Voice de Mozilla. Els textos provenen de diferents sectors, com l’administració pública, proverbis i noms de localitats.

Adreça de descàrrega:

https://github.com/Softcatala/ca-text-corpus
Autors:

Softcatalà

Jordi Mas

Joan Montané

Jaume Ortolà

Llicència:

CC-0 license