La intel·ligència artificial al vostre ordinador personal

Compartiu

Com fer transcripcions i subtitulacions d’àudio i vídeo al vostre ordinador

Transcripció local amb Whisper

Whisper és el model de reconeixement de veu d’OpenAI, disponible de forma gratuïta i que s’executa completament en local, sense enviar dades a cap servidor extern.

Aquests són els tres models principals de Whisper:

  • Small. Requereix ~2 GB de RAM
  • Medium. Requereix ~5 GB RAM (3 cops més lent que l’small)
  • Large. Requereix ~10 GB RAM (2 cops més lent que el medium)

El medium ofereix un bon equilibri entre qualitat i velocitat. Si disposeu de 10 GB de RAM i la precisió és prioritària, el large dona millors resultats en català.

Buzz

Buzz és una aplicació, traduïda al català, per a mac OS, Windows i Linux, que transcriu i tradueix àudio i vídeo de manera local, sense connexió a internet. Utilitza la intel·ligència artificial Whisper d’OpenAI i també permet transcriure el micròfon en temps real.

Com instal·lar Buzz

  1. Aneu a la pàgina de descàrrega i feu clic a l’última versió disponible.
  2. Descarregueu el fitxer corresponent al vostre sistema.
  3. Executeu el fitxer descarregat i seguiu els passos d’instal·lació habituals.

Com transcriure un fitxer d’àudio o vídeo

  1. Obriu Buzz.
  2. Feu clic a «Transcribe File» (Transcriu fitxer).
  3. Seleccioneu el fitxer d’àudio o vídeo que voleu transcriure (MP3, WAV, MP4, MKV, etc.).
  4. Trieu el model de Whisper que voleu fer servir.
  5. Feu clic a «Run» i espereu que acabi la transcripció.

Subtitle Edit

Editor de subtítols molt complet per a Windows, macOS i Linux. Té integració directa amb Whisper per a generar subtítols automàticament a partir d’àudio o vídeo.

  • Ideal si el resultat final ha de ser un fitxer de subtítols (SRT, VTT, ASS…)
  • Permet editar i sincronitzar subtítols manualment
  • Suporta diversos models de Whisper
  • Molt útil per a contingut de vídeo

Com instal·lar Subtitle Edit

  1. Aneu a la pàgina de descàrrega i feu clic a l’última versió disponible.
  2. Descarregueu el fitxer corresponent al vostre sistema.
  3. Executeu el fitxer descarregat i seguiu els passos d’instal·lació habituals.

Com transcriure un fitxer d’àudio o vídeo

  1. Aneu al menú Vídeo i amb l’opció Obre fitxer de vídeo seleccioneu un vídeo o àudio
  2. Aneu al menú Vídeo i amb l’opció Audio to text (Whisper) podreu fer la transcripció

whisper-ctranslate2 (línia d’ordres)

Si heu de transcriure molts fitxers, les eines de línia d’ordres poden ser una bona opció, i a més us proporcionen molt control sobre com es transcriurà el fitxer.

Podeu instal·lar-lo fàcilment amb l’ordre pip install whisper-ctranslate2 i suporta múltiples idiomes, incloent-hi el català, amb models de diferent mida segons les vostres necessitats.

Més informació: https://github.com/Softcatala/whisper-ctranslate2


⬅ Torneu a la pàgina la intel·ligència artificial al teu ordinador personal