Question 1

Como isso é diferente de outras ferramentas de texto para voz?

Accepted Answer

Há três diferenças. (1) O VocalDock permite gerar com créditos antes de você se comprometer com um plano. (2) Suas vozes de TTS ficam junto de outras ferramentas de áudio do VocalDock, como separação vocal, redução de ruído e conversão. (3) O fluxo é baseado em vozes salvas, para você reutilizar uma amostra autorizada sem reenviar o arquivo toda vez.

Question 2

Qual deve ser a duração do áudio de referência?

Accepted Answer

Entre 5 e 30 segundos é o ideal. Usamos os primeiros 28 segundos e o limite é 20 MB. Fala clara, sem música de fundo ou ruído, gera clones de voz melhores; uma gravação ruidosa tende a produzir uma voz clonada mais ruidosa.

Question 3

Posso clonar a voz de uma celebridade ou personagem fictício?

Accepted Answer

Somente vozes que você tem autorização para usar. Não envie áudio de figuras públicas, dubladores, atores de voz ou personagens protegidos por direitos autorais sem autorização. Nossas diretrizes de conteúdo, assim como leis de direito de imagem e voz em muitas jurisdições, proíbem criar clones de voz de pessoas reais sem consentimento.

Question 4

Quais idiomas são compatíveis?

Accepted Answer

São 9 idiomas prontos para uso: inglês, chinês, japonês, coreano, alemão, espanhol, francês, italiano e russo, além de 18 dialetos regionais chineses, incluindo cantonês, sichuanês e xangainês. A mesma voz clonada funciona em todos eles: grave uma vez em inglês e leia um texto em japonês.

Question 5

Quanto custa?

Accepted Answer

15 créditos a cada 1000 caracteres, com mínimo de 5 créditos por tarefa. Um artigo curto de cerca de 3000 caracteres custa 45 créditos. Novos usuários recebem créditos iniciais gratuitos para testar.

Question 6

Quanto tempo leva para gerar?

Accepted Answer

Normalmente 10 a 30 segundos na primeira solicitação, quando o modelo é carregado na GPU, e depois 5 a 10 segundos nas próximas gerações. Textos mais longos levam mais tempo proporcionalmente, porque o modelo gera uma frase por vez.

Question 7

Posso usar o resultado comercialmente?

Accepted Answer

Sim, quando o conteúdo é criado com sua própria voz ou com permissão explícita da pessoa dona da voz. O arquivo de áudio é seu para usar em podcasts, vídeos, anúncios e audiolivros. Não há royalties sobre o áudio gerado.

Question 8

O que acontece com minhas amostras se eu excluir a voz?

Accepted Answer

A exclusão aparece imediatamente na interface; o áudio subjacente no R2 é removido em até 24 horas por limpeza em segundo plano. Nunca usamos áudio de referência enviado por clientes para treinar ou melhorar nossos modelos.

Texto para voz com IA usando sua própria voz

O que esta ferramenta de texto para voz com IA faz?

Clonagem de voz zero-shot, sem tempo de treinamento

9 idiomas e 18 dialetos chineses

Use sua voz, a voz de um familiar ou de um amigo

Pague por caractere, sem precisar de assinatura

Prosódia e ritmo mais naturais

Privacidade: apague suas amostras quando quiser

O que você pode fazer com texto para voz?

Ler artigos com sua própria voz

Gerar aberturas e encerramentos de podcast

Corrigir uma frase em uma gravação

Conteúdo multilíngue a partir de uma voz em inglês

Áudio afetivo ou memorial com a voz de alguém querido

Perguntas frequentes sobre texto para voz

Como isso é diferente de outras ferramentas de texto para voz?

Qual deve ser a duração do áudio de referência?

Posso clonar a voz de uma celebridade ou personagem fictício?

Quais idiomas são compatíveis?

Quanto custa?

Quanto tempo leva para gerar?

Posso usar o resultado comercialmente?

O que acontece com minhas amostras se eu excluir a voz?

Ferramentas relacionadas

Clonar voz

Tirar voz

Remover música do vídeo