Resum de l’any 2022 a Softcatalà

Compartiu

Breu memòria de l'any 2022 a Softcatalà, amb dades del web, avanços en diversos projectes, guardons rebuts i com se'ns presenta el 2023.

Resum de l’any 2022 a Softcatalà

Ja amb el nou any ben iniciat, i com cada any, compartim amb vosaltres els punts més forts del 2022 amb un breu resum de l’any per a Softcatalà.

Dades del web i principals serveis

Durant l’any 2022, el nostre web ha rebut 94,2 milions de visualitzacions de pàgines, un augment del 21% respecte a l’any anterior.

Infografia resum de les fites aconseguides per Softcatalà l'any 2022.

Aquí estan les visites que han rebut els principals serveis de Softcatalà:

  • El corrector ha acabat l’any amb 39,7 milions de visites, un 16% més que durant el 2021.
  • El diccionari de sinònims assoleix els 19 milions de visites, un increment del 48% respecte a l’any anterior. Això es deu a la publicació d’una nova versió del diccionari de sinònims el segon semestre de l’any 2021.
  • El traductor acaba el 2022 ben a prop del diccionari de sinònims, amb 18,9 milions de visites, un 7% més que el període anterior.

Durant el 2022, el servei que ha tingut un increment més alt de visites ha sigut el conjugador de verbs, amb un augment del 138% respecte al 2021 i obtenint 1,9 milions de visites.

Iniciatives dutes a terme durant l’any 2022

Ampliació del diccionari de sinònims totalment renovat

El 2022 hem millorat el diccionari de sinònims, que en aquests moments ja conté 43.200 paraules, agrupades en 9.300 grups, etiquetats amb la corresponent categoria gramatical. En aquest diccionari hi ha marques de col·loquialismes, vulgarismes i arcaismes, i altres aclariments, com ara l’àmbit d’ús del terme; es mostra la flexió de gènere de noms i adjectius, en cas que en tinguin; i totes les paraules que poden portar informació extra amb més sinònims, són enllaços clicables.

Desenvolupament dels serveis de traducció neuronal amb dades i models lliures

Imatge que representa un cervell format per connexions electròniques.

Gràcies a la col·laboració amb alumnes del màster de Tradumàtica de la UAB, hem desenvolupat una primera versió d’un traductor japonès-català.

També hem obert la traducció als parells de llengües gallec-català i occità llenguadocià-català, gràcies a la transferència de coneixements dels models publicats per Meta com a part del projecte No Language Left Behind. Posem a disposició de tothom els corpus i els models neuronals de traducció que fem servir, sota llicència lliure, perquè qualsevol els pugui utilitzar.

Logo de la tecnologia Argos Translate de l'empresa Argos Open Technologies.

També s’ha treballat amb el projecte ArgoTranslate/LibreTranslate (usats pel Mastodon) i Mozilla Translate per donar visibilitat dels nostres recursos i que els usen per a entrenar els seus models de traducció. Finalment, hem doblat la mida dels fitxers que els usuaris ens poden enviar per a traduir fins a 8 MB.

Paral·lelament a les millores implementades al traductor web, estem organitzant tallers sobre traducció neuronal on expliquem el funcionament i el procés d’entrenament d’un motor de traducció neuronal per anar vertebrant una comunitat que conegui aquesta tecnologia.

Millora en el traductor castellà-català

Logotip de l'Apertium

Hem col·laborat amb estudiants del Màster Universitari en Traducció i Tecnologies de la UOC per a millorar el traductor català-castellà basat en tecnologia Apertium. S’ha recopilat un conjunt de textos d’avaluació de 12.000 frases per al castellà-català i 12.000 més per al català-castellà, que s’han traduït amb Apertium i revisat manualment per avaluar-ne les traduccions i identificar-hi les millores.

Gràcies a aquest procés es van identificar més de 80 millores i se n’han implementat 50 al projecte lliure Apertium per a millorar la traducció del castellà al català.

Common Voice i models de reconeixement de la parla

Al projecte Common Voice de Mozilla durant l’any 2022, i gràcies a la promoció del projecte AINA, s’han enregistrat i validat 1.700 hores de veu, amb un total acumulat des de juny del 2018, quan es va iniciar el projecte català de Common Voice, de 2.700 hores validades, gràcies a la participació de més de 30.000 persones. El català és la segona llengua amb més hores validades del projecte Common Voice i també la segona en hores enregistrades.

Imatge del Common Voice de Mozilla.

L’objectiu inicial era arribar a 1.000 hores i desenvolupar un motor de reconeixement de la parla bàsic i lliure per al català, i l’hem superat àmpliament. El nou objectiu que ens hem proposat és arribar a les 5.000 hores i desenvolupar i millorar eines lingüístiques avançades. Les dades del Common Voice estan a disposició de tothom que vulgui, lliurement i de franc. Per exemple, Facebook ja les fa servir per a traduir veu en català a text en anglès, o veu en anglès a text en català.

Projectes de traducció

L’any 2022 hem continuat treballant en noves versions del navegador Firefox, el paquet ofimàtic LibreOffice, l’escriptori GNOME, el programa de retoc fotogràfic Gimp i el programa de dibuix vectorial Inkscape, entre d’altres.

Un any de guardons i participacions

Durant el 2022, dues entitats han pensat en nosaltres per als seus guardons. Per a nosaltres és tot un honor rebre aquests reconeixements, per això els hem incorporat a aquest resum de l’any 2022:

També ens han convidat a participar en diverses activitats:

  • SAGA – Saló del Gaming, 3 i 4 de desembre de 2022. Durant tot el cap de setmana, el company Artur Vicedo va estar a l’estand on es podien enregistrar i validar talls de veu per al Common Voice. A més, i conjuntament amb el company Francesc del projecte Ce Trencada, va participar de la xerrada: «El català als videojocs, internet i les TIC. Com ho podem millorar?»
  • Seminari de Sobirania digital-tecnològica, pobles i llengües minoritzades, 16 de desembre de 2022. La companya Belén Ivars va participar amb la xerrada «Descolonització digital: programari, eines i recursos en català», organitzada per Ciemen i el Departament de Filologia Catalana i Comunicació de la Universitat de Lleida.

L’any 2023 a Softcatalà

Aquest any en el qual ja ens trobem serà un any ben important per a nosaltres. A l’octubre, farà 25 anys que vam iniciar el nostre camí per aquest món de l’activisme lingüístic i tecnològic.

Durant aquests vint-i-cinc anys hem dut a terme moltes iniciatives, sempre alineades al nostre objectiu: promoure l’ús del català a Internet i les noves tecnologies. Vam començar traduint el navegador Netscape, seguit de moltes més traduccions, eines, serveis, programes, recursos, xerrades, tallers, trobades…

Un quart de segle ha donat per a molt, i volem compartir aquest aniversari amb tota la gent que ens heu fet costat durant tot aquest temps, així que estigueu a l’aguait! De moment, us donem les gràcies pel vostre suport incondicional, us continuarem informant.

Softcatalà fa 25 anys, enguany.

Quant a Softcatalà

Softcatalà som una associació sense afany de lucre que treballa per la normalització de la llengua catalana en el sector informàtic, Internet i les noves tecnologies, a partir de la traducció de programari lliure de distribució gratuïta i creació de recursos lingüístics lliures i oberts a tothom. Per a més informació sobre els programes traduïts i els projectes de l’associació, podeu consultar el nostre lloc web a http://www.softcatala.org.


Comentaris