Breu memòria de l'any 2022 a Softcatalà, amb dades del web, avanços en diversos projectes, guardons rebuts i com se'ns presenta el 2023.
Ja amb el nou any ben iniciat, i com cada any, compartim amb vosaltres els punts més forts del 2022 amb un breu resum de l’any per a Softcatalà.
Dades del web i principals serveis
Durant l’any 2022, el nostre web ha rebut 94,2 milions de visualitzacions de pàgines, un augment del 21% respecte a l’any anterior.
Aquí estan les visites que han rebut els principals serveis de Softcatalà:
- El corrector ha acabat l’any amb 39,7 milions de visites, un 16% més que durant el 2021.
- El diccionari de sinònims assoleix els 19 milions de visites, un increment del 48% respecte a l’any anterior. Això es deu a la publicació d’una nova versió del diccionari de sinònims el segon semestre de l’any 2021.
- El traductor acaba el 2022 ben a prop del diccionari de sinònims, amb 18,9 milions de visites, un 7% més que el període anterior.
Durant el 2022, el servei que ha tingut un increment més alt de visites ha sigut el conjugador de verbs, amb un augment del 138% respecte al 2021 i obtenint 1,9 milions de visites.
Iniciatives dutes a terme durant l’any 2022
Ampliació del diccionari de sinònims totalment renovat
El 2022 hem millorat el diccionari de sinònims, que en aquests moments ja conté 43.200 paraules, agrupades en 9.300 grups, etiquetats amb la corresponent categoria gramatical. En aquest diccionari hi ha marques de col·loquialismes, vulgarismes i arcaismes, i altres aclariments, com ara l’àmbit d’ús del terme; es mostra la flexió de gènere de noms i adjectius, en cas que en tinguin; i totes les paraules que poden portar informació extra amb més sinònims, són enllaços clicables.
Desenvolupament dels serveis de traducció neuronal amb dades i models lliures
Gràcies a la col·laboració amb alumnes del màster de Tradumàtica de la UAB, hem desenvolupat una primera versió d’un traductor japonès-català.
També hem obert la traducció als parells de llengües gallec-català i occità llenguadocià-català, gràcies a la transferència de coneixements dels models publicats per Meta com a part del projecte No Language Left Behind. Posem a disposició de tothom els corpus i els models neuronals de traducció que fem servir, sota llicència lliure, perquè qualsevol els pugui utilitzar.
També s’ha treballat amb el projecte ArgoTranslate/LibreTranslate (usats pel Mastodon) i Mozilla Translate per donar visibilitat dels nostres recursos i que els usen per a entrenar els seus models de traducció. Finalment, hem doblat la mida dels fitxers que els usuaris ens poden enviar per a traduir fins a 8 MB.
Paral·lelament a les millores implementades al traductor web, estem organitzant tallers sobre traducció neuronal on expliquem el funcionament i el procés d’entrenament d’un motor de traducció neuronal per anar vertebrant una comunitat que conegui aquesta tecnologia.
Millora en el traductor castellà-català
Hem col·laborat amb estudiants del Màster Universitari en Traducció i Tecnologies de la UOC per a millorar el traductor català-castellà basat en tecnologia Apertium. S’ha recopilat un conjunt de textos d’avaluació de 12.000 frases per al castellà-català i 12.000 més per al català-castellà, que s’han traduït amb Apertium i revisat manualment per avaluar-ne les traduccions i identificar-hi les millores.
Gràcies a aquest procés es van identificar més de 80 millores i se n’han implementat 50 al projecte lliure Apertium per a millorar la traducció del castellà al català.
Common Voice i models de reconeixement de la parla
Al projecte Common Voice de Mozilla durant l’any 2022, i gràcies a la promoció del projecte AINA, s’han enregistrat i validat 1.700 hores de veu, amb un total acumulat des de juny del 2018, quan es va iniciar el projecte català de Common Voice, de 2.700 hores validades, gràcies a la participació de més de 30.000 persones. El català és la segona llengua amb més hores validades del projecte Common Voice i també la segona en hores enregistrades.
L’objectiu inicial era arribar a 1.000 hores i desenvolupar un motor de reconeixement de la parla bàsic i lliure per al català, i l’hem superat àmpliament. El nou objectiu que ens hem proposat és arribar a les 5.000 hores i desenvolupar i millorar eines lingüístiques avançades. Les dades del Common Voice estan a disposició de tothom que vulgui, lliurement i de franc. Per exemple, Facebook ja les fa servir per a traduir veu en català a text en anglès, o veu en anglès a text en català.
Projectes de traducció
L’any 2022 hem continuat treballant en noves versions del navegador Firefox, el paquet ofimàtic LibreOffice, l’escriptori GNOME, el programa de retoc fotogràfic Gimp i el programa de dibuix vectorial Inkscape, entre d’altres.
Un any de guardons i participacions
Durant el 2022, dues entitats han pensat en nosaltres per als seus guardons. Per a nosaltres és tot un honor rebre aquests reconeixements, per això els hem incorporat a aquest resum de l’any 2022:
- XX Premis Joan Coromines, 12 de novembre de 2022. Els premis Nacionals Joan Coromines són atorgats per la Coordinadora d’Associacions per la Llengua Catalana (CAL). Durant l’acte, ens va representar el company Josep M Closa.
- Premi Cultura de l’APPEC, 29 de novembre de 2022. Aquest guardó està dins la categoria de premis especials de la junta. En aquesta ocasió, ens van representar els companys Pere Orga i Jaume Ortolà.
També ens han convidat a participar en diverses activitats:
- SAGA – Saló del Gaming, 3 i 4 de desembre de 2022. Durant tot el cap de setmana, el company Artur Vicedo va estar a l’estand on es podien enregistrar i validar talls de veu per al Common Voice. A més, i conjuntament amb el company Francesc del projecte Ce Trencada, va participar de la xerrada: «El català als videojocs, internet i les TIC. Com ho podem millorar?»
- Seminari de Sobirania digital-tecnològica, pobles i llengües minoritzades, 16 de desembre de 2022. La companya Belén Ivars va participar amb la xerrada «Descolonització digital: programari, eines i recursos en català», organitzada per Ciemen i el Departament de Filologia Catalana i Comunicació de la Universitat de Lleida.
L’any 2023 a Softcatalà
Aquest any en el qual ja ens trobem serà un any ben important per a nosaltres. A l’octubre, farà 25 anys que vam iniciar el nostre camí per aquest món de l’activisme lingüístic i tecnològic.
Durant aquests vint-i-cinc anys hem dut a terme moltes iniciatives, sempre alineades al nostre objectiu: promoure l’ús del català a Internet i les noves tecnologies. Vam començar traduint el navegador Netscape, seguit de moltes més traduccions, eines, serveis, programes, recursos, xerrades, tallers, trobades…
Un quart de segle ha donat per a molt, i volem compartir aquest aniversari amb tota la gent que ens heu fet costat durant tot aquest temps, així que estigueu a l’aguait! De moment, us donem les gràcies pel vostre suport incondicional, us continuarem informant.
Quant a Softcatalà
Softcatalà som una associació sense afany de lucre que treballa per la normalització de la llengua catalana en el sector informàtic, Internet i les noves tecnologies, a partir de la traducció de programari lliure de distribució gratuïta i creació de recursos lingüístics lliures i oberts a tothom. Per a més informació sobre els programes traduïts i els projectes de l’associació, podeu consultar el nostre lloc web a http://www.softcatala.org.