Transcripció d’àudio i vídeo a text

Compartiu

Aquesta pàgina ofereix un servei gratuït de transcripció (també anomenat dictat) d'àudio i vídeo a text usant IA. Això pot ser útil per a transcriure gravacions, apunts o pòdcasts a text o per a crear subtítols per a vídeos.

Transcripció de fitxers a text

Podeu enviar-nos un fitxer d'àudio o vídeo. Us avisarem per correu quan estigui transcrit i el podreu passar a recollir a la nostra pàgina web. Hi ha una cua de fitxers que anem processant. Pot trigar més o menys segons el nombre de transcripcions pendents de processar.

Mida màxima del fitxer: 1GB. Formats admesos: mp3, wav, ogg, flac, avi, mp4, mov, mkv i mts

Pujada: 0 %

Quant als models que podeu utilitzar
Aquest servei utilitza els models de reconeixement de la parla Whisper. Considerem que són els models lliures de millor qualitat existents per al català, són resilients al soroll de fons i prediuen també la puntuació i majúscules. Oferim diverses variants dels models: com més gran és el model, millor qualitat us donarà, però més temps trigarà a processar-se el fitxer.

Voleu fer la transcripció al vostre ordinador?
El Buzz és un programa que us permet transcriure a Windows i macOS usant els mateixos models que oferim aquí. El podeu baixar d’aquí.

Altres opcions de transcripció d’àudio al català
També existeixen aquestes possibilitats addicionals, que us poden ser útils segons la tasca que vulgueu fer:
oTranscribe+ del projecte Aina – S’executa en el navegador, permet transcripció en temps real i editar-la posteriorment.
dictation.io – Ofereix transcripció de dictats en temps real (usa Google Cloud) i requereix un navegador que usi el motor de Chrome.
Google Docs i Google Workspace – L’opció de dictat de veu requereix un navegador que usi el motor de Chrome.
transcribe de Wreally – Opció professional de pagament.
HappyScribe – Opció professional de pagament.
Servei STT al núvol de Google – El servei al núvol de pagament de Google que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.
Servei STT al núvol Azure de Microsoft – El servei al núvol de pagament de Microsoft que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.
Servei STT al núvol d’OpenAI – El servei al núvol de pagament d’OpenAI que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.

Privadesa de les dades
Els fitxers que els usuaris envien al servei de transcripció s’envien al servidor de Softcatalà mitjançant una connexió segura. Després de 72 hores se suprimeixen totes les dades. Vegeu l’avís legal.