LVC-VC utilizes carefully designed input features that have disentangled content and speaker style information, and the neural vocoder-like architecture learns to combine them to perform voice conversion while simultaneously synthesizing audio.
|
LVC-VC utilitza funcions d’entrada dissenyades acuradament que han desenredat el contingut i la informació de l’estil del parlant, i l’arquitectura similar a un codificador de veu neuronal aprèn a combinar-los per realitzar la conversió de veu mentre sintetitza àudio simultàniament.
|