VoicePowered v1

Presentamos VoicePowered v1, un modelo Text to Speech open source centrado en la clonaci贸n de voces con acento espa帽ol. Este modelo es un fine-tuning del modelo F5-TTS (https://huggingface.co/SWivid/F5-TTS)

Ofrecemos una app Gradio donde probar el modelo. Esta app incluye generaci贸n de una voz y generaci贸n multi-voz.

Para la selecci贸n de los audios de referencia, por favor sigan las siguientes pautas.

  • El audio de referencia debe durar menos de 15 segundos. Dentro de estos 15 segundos, debe haber un peque帽o silencio al principio y al final del audio. Preferiblemente, dentro del audio debe haber frases completas.
  • El modelo utilizar谩 las caracter铆sticas de este audio para la generaci贸n, incluyendo la velocidad del habla, la prosodia, la emoci贸n, las pronunciaciones, e incluso la calidad del audio, por lo que hay que asegurarse que se utiliza un audio de referencia con las caracter铆sticas del audio deseado.
Downloads last month
20
Inference Providers NEW
This model isn't deployed by any Inference Provider. 馃檵 Ask for provider support

Model tree for VoicePoweredAI/VoicePoweredAI_Spanish_v1

Base model

SWivid/F5-TTS
Finetuned
(68)
this model