Com fer transcripcions i subtitulacions d’àudio i vídeo al teu ordinador
Transcripció local amb Whisper
Whisper és el model de reconeixement de veu d’OpenAI, disponible de forma gratuïta i que s’executa completament en local, sense enviar dades a cap servidor extern.
Aquests són els tres models principals de Whisper:
- Small . Requereix ~2GB de RAM
- Medium. Requereix ~5GB RAM (3 cops més lent que l’small)
- Large. Requereix ~10GB RAM (2 cops més lent que el medium)
El medium ofereix un bon equilibri entre qualitat i velocitat. Si disposeu de 10 GB de RAM i la precisió és prioritària, el large dona millors resultats en català.
Buzz
Buzz és una aplicació traduida al català per a mac OS, Windows i Linux que transcriu i tradueix àudio i vídeo de manera local, sense connexió a internet. Utilitza la intel·ligència artificial Whisper d’OpenAI i també permet transcriure el micròfon en temps real.

Com instal·lar Buzz
1. Aneu a la pàgina de descàrrega https://github.com/chidiwilliams/buzz i feu clic a l’última versió disponible
2. Descarregueu el fitxer corresponent al teu sistema.
3. Executeu el fitxer descarregat i segueix els passos d’instal·lació habituals.
Com transcriure un fitxer d’àudio o vídeo
1. Obriu Buzz.
2. Feu clic a “Transcribe File” (Transcriu fitxer).
3. Seleccioneu el fitxer d’àudio o vídeo que vols transcriure (MP3, WAV, MP4, MKV, etc.).
4. Trieu el model de Whisper que voleu fer servir
5. Feu clic a “Run” i espera que acabi la transcripció.
Subtitle Edit
Editor de subtítols molt complet per a Windows, macOS i Linux. Té integració directa amb Whisper per generar subtítols automàticament a partir d’àudio o vídeo. Es pot baixar des de:
- Ideal si el resultat final ha de ser un fitxer de subtítols (SRT, VTT, ASS…)
- Permet editar i sincronitzar subtítols manualment
- Suporta diversos models de Whisper
- Molt útil per a contingut de vídeo

Com instal·lar Subtitle Edit
1. Aneu a la pàgina de descàrrega https://github.com/SubtitleEdit/subtitleedit/releases i feu clic a l’última versió disponible
2. Descarregueu el fitxer corresponent al teu sistema:
3. Executeu el fitxer descarregat i segueix els passos d’instal·lació habituals.
Com transcriure un fitxer d’àudio o vídeo
1. Aneu al menú Vídeo i amb l’opció Obre fitxer de vídeo seleccioneu un vídeo o àudio
2. Aneu al menú Vídeo i amb l’opció Àudio to text (Whisper) podreu fer la transcripció
whisper-ctranslate2 (línia d’ordres)
Si heu de transcriure molts fitxers les eines de línia d’odres poden ser una bona opció que a més us proporciona molt control sobre com el fitxer es transcriurà.
Podeu instal·lar-lo fàcilment amb pip install whisper-ctranslate2 i suporta múltiples idiomes, incloent el català, amb models de diferent mida segons les vostres necessitats.
Més informació: https://github.com/Softcatala/whisper-ctranslate2

⬅ Torneu a la pàgina la intel·ligència artificial al teu ordinador personal