Common Voice

Mecànica de col·laboració

  1. Creeu un perfil (opcional).
  2. Establiu una fita diària o setmanal de talls de veu que voleu enregistrar o revisar.
  3. Enregistreu o reviseu de talls de veu en tongades de 5 talls.
  4. Torneu al punt 2 fins a arribar a la fita diària o setmanal establerta.

Creació del perfil (opcional)

  • És molt recomanable que definiu les dades demogràfiques del vostre perfil: llengua, gènere, edat i dialecte. Això fa que les dades siguin més útils i poder reconèixer millor tots els dialectes del català.
  • El perfil  d’usuari es desa en una galeta en el navegador, no pas al servidor. No hi ha cap usuari ni contrasenya. Les dades que envieu a Common Voice són anònimes i no es podran associar a ningú.
  • Si canvieu d’aparell o navegador, o esborreu les galetes, caldrà que definiu altre cop les dades del vostre perfil.

Enregistrament de talls de veu

La tasca principal de Common Voice és l’enregistrament de petits talls de veu, però amb una vegada no n’hi ha prou. Tingueu present que 1.000 hores són moltes hores, Common Voice és una cursa de fons. El millor és que us poseu una fita diària o setmanal de talls que voleu enregistrar i ho feu sempre a la mateixa hora.

  • Llegiu les frases exactament com estan escrites, de forma clara i natural.
  • Feu una entonació correcta de la frase. Per exemple, si és una pregunta feu-la amb entonació interrogativa.
  • Assegureu-vos de no tapar el micròfon durant l’enregistrament.
  • Feu servir sempre el vostre dialecte, però respectant el text de la frase. P. ex. si hi ha escrit «construïx» i parleu català oriental, no feu «construeix».
  • Si el text de la frase proposada no s’ajusta al vostre dialecte,1 o la trobeu difícil de llegir, podeu ignorar-la i enregistrar-ne una altra. Teniu moltíssimes frases, no us les acabareu.
  • Almenys al principi, escolteu els vostres enregistraments abans de fer una altra tongada de 5 talls.

Revisió de talls de veu

Cal revisar els talls de veu que s’enregistren en l’apartat anterior. Un tall de veu és vàlid si aconsegueix, almenys, 2/3 de vots positius. Igual que amb l’enregistrament, cal ser constant per poder arribar a les 1.000 hores validades.

  • Sigueu flexibles. L’objectiu del Common Voice és fer un motor de reconeixement de veu de qualsevol parlant, també d’algú no nadiu, no pas un motor de síntesi de veu amb una dicció perfecta.
  • Si la transcripció del tall es correspon amb el text mostrat, valideu la frase. Altrament, rebutgeu-la.
  • La frase que escolteu s’ha de correspondre amb el text escrit paraula per paraula.
  • De vegades el reproductor d’àudio falla. Si el text es talla, abans de rebutjar la frase, torneu a escoltar-la. Si continua tallant-se, podeu rebutjar-la.
  • No importa si l’àudio és molt baix o molt alt. Sempre que s’entengui la locució.
  • No importa que el dialecte del locutor no correspongui amb les formes verbals o el lèxic (p. ex. «patesques» pronunciat amb vocal neutra). El que importa és que la frase es correspongui amb el text escrit, estigui ben llegida i usant el mateix dialecte durant tota la frase.
  • No importa que hi hagi soroll de fons, mentre la frase s’entengui.
  • Si us trobeu amb alguna cosa que aquestes pautes no cobreixen, voteu segons el vostre criteri. Si realment no ho podeu decidir, feu servir el botó Omet i passeu a l’enregistrament següent. N’hi ha moltíssims per validar, no us els acabareu.

1. Les frases són comunes per a tothom. Malauradament, la plataforma no permet assignar frases segons el dialecte del locutor.