Transcripció d’àudio i vídeo a text

Compartiu

Aquesta pàgina ofereix un servei gratuït de transcripció (també anomenat dictat) d'àudio i vídeo a text usant IA. La transcripció pot contenir errors i és important que la reviseu. Aquesta eina pot ser útil per a transcriure gravacions, apunts o pòdcasts a text o per a crear subtítols per a vídeos.

Transcripció de fitxers a text

Podeu enviar-nos un fitxer d'àudio o vídeo. Us avisarem per correu quan estigui transcrit i el podreu passar a recollir a la nostra pàgina web. Hi ha una cua de fitxers que anem processant. Pot trigar més o menys segons el nombre de transcripcions pendents de processar.

Model que voleu utilitzar:

Correu on voleu que us avisem:

Mostra opcions específiques per generar fitxers de subtítols (.srt)

Seleccioneu un fitxer d'àudio o vídeo

Mida màxima del fitxer: 1GB. Formats admesos: mp3, wav, ogg, flac, avi, mp4, mov, mkv i mts

Quant als models que podeu utilitzar
Aquest servei utilitza els models de reconeixement de la parla Whisper. Considerem que són els models lliures de millor qualitat existents per al català, són resilients al soroll de fons i prediuen també la puntuació i majúscules. Oferim diverses variants dels models: com més gran és el model, millor qualitat us donarà, però més temps trigarà a processar-se el fitxer.

Voleu fer la transcripció al vostre ordinador?
El Buzz és un programa que us permet transcriure a Windows i macOS usant els mateixos models que oferim aquí. El podeu baixar d’aquí.

Privadesa de les dades
Els fitxers que els usuaris envien al servei de transcripció s’envien al servidor de Softcatalà mitjançant una connexió segura. Després de 72 hores se suprimeixen totes les dades. Vegeu l’avís legal.