Clonagem de voz

Nosso sistema consegue captar uma voz gravada ou ao vivo e criar um modelo de voz que imita fielmente o timbre e entonação da voz original.

Esse modelo é integrado a um software de texto-para-voz, permitindo que qualquer texto seja reproduzido com a mesma voz da pessoa gravada, garantindo máxima naturalidade e precisão.

O que faz?

Com o sistema de Clonagem de Voz, também é possível criar vozes novas e naturais, mesmo sem ter ouvido a voz antes. Ele também permite gerar discursos programados usando a voz clonada, trazendo versatilidade e precisão na comunicação.

Nosso sistema é composto por 3 componentes independentes

Codificador de voz​

Codificador de voz

Rede que analisa amostras de vozes de milhares de pessoas, mesmo em ambientes barulhentos e sem transcrições, para criar um modelo único de cada voz a partir de apenas alguns segundos de áudio.

Síntese de fala

Converte texto em áudio, adaptando-se à voz clonada para gerar um espectrograma, que é uma representação visual das frequências sonoras da fala.

Vocoder

Transforma o espectrograma em som real, reproduzindo a voz com naturalidade e clareza no formato de ondas sonoras.

Mais funcionalidades

Além de clonar vozes já existentes, nosso sistema pode criar novas vozes combinando trechos aleatórios de amostras. Ele também pode ser usado para tradução, analisando a voz em um idioma e reproduzindo uma versão semelhante em inglês, mantendo o timbre e a entonação da voz original.