Aquesta pàgina ofereix un servei gratuït de transcripció (també anomenat dictat) d'àudio i vídeo a text usant IA. Això pot ser útil per a transcriure gravacions, apunts o pòdcasts a text o per a crear subtítols per a vídeos.
Quant als models que podeu utilitzar
Aquest servei utilitza els models de reconeixement de la parla Whisper. Considerem que són els models lliures de millor qualitat existents per al català, són resilients al soroll de fons i prediuen també la puntuació i majúscules. Oferim diverses variants dels models: com més gran és el model, millor qualitat us donarà, però més temps trigarà a processar-se el fitxer.
Voleu fer la transcripció al vostre ordinador?
El Buzz és un programa que us permet transcriure a Windows i macOS usant els mateixos models que oferim aquí. El podeu baixar d’aquí.
Altres opcions de transcripció d’àudio al català
També existeixen aquestes possibilitats addicionals, que us poden ser útils segons la tasca que vulgueu fer:
• Fes-me l’acta! – Traducció des del navegador amb Chrome
• oTranscribe+ del projecte Aina – S’executa en el navegador, permet transcripció en temps real i editar-la posteriorment.
• dictation.io – Ofereix transcripció de dictats en temps real (usa Google Cloud) i requereix un navegador que usi el motor de Chrome.
• Google Docs i Google Workspace – L’opció de dictat de veu requereix un navegador que usi el motor de Chrome.
• transcribe de Wreally – Opció professional de pagament.
• HappyScribe – Opció professional de pagament.
• Servei STT al núvol de Google – El servei al núvol de pagament de Google que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.
• Servei STT al núvol Azure de Microsoft – El servei al núvol de pagament de Microsoft que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.
• Servei STT al núvol d’OpenAI – El servei al núvol de pagament d’OpenAI que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.
• Serveis STT de Verbio – Serveis professionals de STT: Speech-to-Text Streaming i Speech-to-Text Batch.
Privadesa de les dades
Els fitxers que els usuaris envien al servei de transcripció s’envien al servidor de Softcatalà mitjançant una connexió segura. Després de 72 hores se suprimeixen totes les dades. Vegeu l’avís legal.