Com fer transcripcions i subtitulacions d’àudio i vídeo al vostre ordinador
Transcripció local amb Whisper
Whisper és el model de reconeixement de veu d’OpenAI, disponible de forma gratuïta i que s’executa completament en local, sense enviar dades a cap servidor extern.
Aquests són els tres models principals de Whisper:
- Small. Requereix ~2 GB de RAM
- Medium. Requereix ~5 GB RAM (3 cops més lent que l’small)
- Large. Requereix ~10 GB RAM (2 cops més lent que el medium)
El medium ofereix un bon equilibri entre qualitat i velocitat. Si disposeu de 10 GB de RAM i la precisió és prioritària, el large dona millors resultats en català.
Buzz
Buzz és una aplicació, traduïda al català, per a mac OS, Windows i Linux, que transcriu i tradueix àudio i vídeo de manera local, sense connexió a internet. Utilitza la intel·ligència artificial Whisper d’OpenAI i també permet transcriure el micròfon en temps real.

Com instal·lar Buzz
- Aneu a la pàgina de descàrrega i feu clic a l’última versió disponible.
- Descarregueu el fitxer corresponent al vostre sistema.
- Executeu el fitxer descarregat i seguiu els passos d’instal·lació habituals.
Com transcriure un fitxer d’àudio o vídeo
- Obriu Buzz.
- Feu clic a «Transcribe File» (Transcriu fitxer).
- Seleccioneu el fitxer d’àudio o vídeo que voleu transcriure (MP3, WAV, MP4, MKV, etc.).
- Trieu el model de Whisper que voleu fer servir.
- Feu clic a «Run» i espereu que acabi la transcripció.
Subtitle Edit
Editor de subtítols molt complet per a Windows, macOS i Linux. Té integració directa amb Whisper per a generar subtítols automàticament a partir d’àudio o vídeo.
- Ideal si el resultat final ha de ser un fitxer de subtítols (SRT, VTT, ASS…)
- Permet editar i sincronitzar subtítols manualment
- Suporta diversos models de Whisper
- Molt útil per a contingut de vídeo

Com instal·lar Subtitle Edit
- Aneu a la pàgina de descàrrega i feu clic a l’última versió disponible.
- Descarregueu el fitxer corresponent al vostre sistema.
- Executeu el fitxer descarregat i seguiu els passos d’instal·lació habituals.
Com transcriure un fitxer d’àudio o vídeo
- Aneu al menú Vídeo i amb l’opció Obre fitxer de vídeo seleccioneu un vídeo o àudio
- Aneu al menú Vídeo i amb l’opció Audio to text (Whisper) podreu fer la transcripció
whisper-ctranslate2 (línia d’ordres)
Si heu de transcriure molts fitxers, les eines de línia d’ordres poden ser una bona opció, i a més us proporcionen molt control sobre com es transcriurà el fitxer.
Podeu instal·lar-lo fàcilment amb l’ordre pip install whisper-ctranslate2 i suporta múltiples idiomes, incloent-hi el català, amb models de diferent mida segons les vostres necessitats.
Més informació: https://github.com/Softcatala/whisper-ctranslate2

⬅ Torneu a la pàgina la intel·ligència artificial al teu ordinador personal