La intel·ligència artificial al vostre ordinador personal

Compartiu

Com fer transcripcions i subtitulacions d’àudio i vídeo al teu ordinador

Transcripció local amb Whisper

Whisper és el model de reconeixement de veu d’OpenAI, disponible de forma gratuïta i que s’executa completament en local, sense enviar dades a cap servidor extern.

Aquests són els tres models principals de Whisper:

  • Small . Requereix ~2GB de RAM
  • Medium. Requereix ~5GB RAM (3 cops més lent que l’small)
  • Large. Requereix ~10GB RAM (2 cops més lent que el medium)

El medium ofereix un bon equilibri entre qualitat i velocitat. Si disposeu de 10 GB de RAM i la precisió és prioritària, el large dona millors resultats en català.

Buzz

Buzz és una aplicació traduida al català per a mac OS, Windows i Linux que transcriu i tradueix àudio i vídeo de manera local, sense connexió a internet. Utilitza la intel·ligència artificial Whisper d’OpenAI i també permet transcriure el micròfon en temps real.

Com instal·lar Buzz

1. Aneu a la pàgina de descàrrega https://github.com/chidiwilliams/buzz i feu clic a l’última versió disponible

2. Descarregueu el fitxer corresponent al teu sistema.

3. Executeu el fitxer descarregat i segueix els passos d’instal·lació habituals.

Com transcriure un fitxer d’àudio o vídeo

1. Obriu Buzz.

2. Feu clic a “Transcribe File” (Transcriu fitxer).

3. Seleccioneu el fitxer d’àudio o vídeo que vols transcriure (MP3, WAV, MP4, MKV, etc.).

4. Trieu el model de Whisper que voleu fer servir

5. Feu clic a “Run” i espera que acabi la transcripció.

Subtitle Edit

Editor de subtítols molt complet per a Windows, macOS i Linux. Té integració directa amb Whisper per generar subtítols automàticament a partir d’àudio o vídeo. Es pot baixar des de:

  • Ideal si el resultat final ha de ser un fitxer de subtítols (SRT, VTT, ASS…)
  • Permet editar i sincronitzar subtítols manualment
  • Suporta diversos models de Whisper
  • Molt útil per a contingut de vídeo

Com instal·lar Subtitle Edit

1. Aneu a la pàgina de descàrrega https://github.com/SubtitleEdit/subtitleedit/releases i feu clic a l’última versió disponible

2. Descarregueu el fitxer corresponent al teu sistema:

3. Executeu el fitxer descarregat i segueix els passos d’instal·lació habituals.

Com transcriure un fitxer d’àudio o vídeo

1. Aneu al menú Vídeo i amb l’opció Obre fitxer de vídeo seleccioneu un vídeo o àudio

2. Aneu al menú Vídeo i amb l’opció Àudio to text (Whisper) podreu fer la transcripció

whisper-ctranslate2 (línia d’ordres)

Si heu de transcriure molts fitxers les eines de línia d’odres poden ser una bona opció que a més us proporciona molt control sobre com el fitxer es transcriurà.

Podeu instal·lar-lo fàcilment amb pip install whisper-ctranslate2 i suporta múltiples idiomes, incloent el català, amb models de diferent mida segons les vostres necessitats.

Més informació: https://github.com/Softcatala/whisper-ctranslate2


⬅ Torneu a la pàgina la intel·ligència artificial al teu ordinador personal