Oferta por tempo limitado- 50% DE DESCONTO ANUALResgatar
Clonagem de voz · Fish Audio S2

Clone qualquer voz em 15 segundos.

Jogue um clipe de 10 segundos e receba uma voz pronta em segundos. Faça um presidente em exercício narrar seu app de namoro, rode um lançamento de bilionário da tecnologia para sua pior ideia ou crie um podcast fake-panel — sem cabine e sem imitador contratado.

Amostra de 10s é suficienteStreaming abaixo de 300msModelo S2 open-sourcePlano grátis, sem cartão

Leia o parágrafo acima:

Desenvolvido por Fish Audio S2 Pro
LIBERTA TODO O PODER DO ÁUDIO

Feito para velocidade, entregue sem espera

Dez segundos de áudio. Uma voz utilizável em segundos. Sem longas sessões de estúdio, sem fila de treinamento e sem barreira de plano premium.

Clone de 10 segundos

Um clipe curto basta. Sem sessão de estúdio de 30 minutos, sem plano premium obrigatório.

Fidelidade de estúdio

Captura timbre, cadência e microprosódia na primeira tentativa — até em gravações de campo com ruído.

Pronto em segundos

Entrega instantânea. Nenhuma fila de treinamento de várias horas entre você e uma voz utilizável.

Zero-shot em 13 idiomas

Clone uma vez, fale em qualquer lugar. Sem modelo multilíngue separado, sem treinamento extra, sem regravação.

Emoção que sobrevive ao clone

Raiva, ironia, hesitação — os pequenos detalhes que tornam uma voz reconhecível passam por cada frase.

S2 open-source, pronto para API

Hospede o modelo você mesmo, use nosso endpoint de streaming abaixo de 300ms ou leve vozes para seus agentes e apps.

Por que Fish Audio S2

Clonagem rápida, implantação aberta, vozes globais e streaming feito para produção.

Áudio de referência

10 segundos bastam

Tempo até ficar pronto

Segundos, não horas

Cross-lingual

Zero-shot em 13 idiomas

Latência de streaming

Abaixo de 300ms ponta a ponta

Abertura do modelo

S2 open-source, auto-hospedável

Plano grátis

Comece grátis, sem cartão

Para que criadores realmente usam

Esquetes, takes e crossovers feitos para feeds — não para salas de reunião.

Reels de esquete e imitação

Jogue um rant populista no seu colapso de app de namoro, faça um bilionário da tecnologia anunciar sua pior ideia de startup ou solte um quadro semanal de imitação. Sem cabine, sem imitador contratado — grave a piada e publique o clipe.

Canais de takes 24/7

Crie um canal de hot takes que reage às notícias do dia antes de dormir, monte um podcast fake-panel com cohosts que você jamais conseguiria no Zoom ou alimente um host AI com uma notícia por dia.

Memes que viajam

Pegue uma imitação em inglês e publique a mesma entrega em espanhol, japonês ou árabe na mesma tarde. Uma piada, toda região — o algoritmo não liga para o fuso horário que você está farmando.

Clone uma voz que move salas

10 segundos de áudio. Uma chamada de API. Vozes prontas para clipes de humor, canais de react, podcasts de paródia e memes multilíngues.

Plano grátis, sem cartãoReferência de 10 segundos bastaModelo S2 open-source

Perguntas frequentes

Fish Audio S2 clona a partir de uma amostra de 10 segundos, entrega streaming abaixo de 300ms e produz saída zero-shot cross-lingual em 13 idiomas — e o próprio modelo é open-source. Experimente na página de clonagem de voz.

Dez segundos de fala limpa são suficientes. Amostras mais longas podem ajudar em vozes muito expressivas, mas a maioria dos clipes de figuras públicas, cortes de podcast ou gravações com qualidade de telefone funciona na primeira tentativa.

Sim. S2 é zero-shot cross-lingual em 13 idiomas. Clone um discurso em inglês uma vez e entregue a mesma voz em espanhol, japonês, árabe ou qualquer idioma compatível sem retreinamento.

Você é responsável por confirmar que possui os direitos, consentimentos e divulgações necessários para qualquer voz que clone, e por cumprir as leis aplicáveis na sua região, incluindo regras sobre nome, imagem e conteúdo gerado por IA. A Fish Audio não faz pré-aprovação de casos de uso individuais e pode remover conteúdos ou contas que violem nossos termos ou a lei aplicável.

Sim. Planos pagos incluem direitos comerciais, e a API de streaming entrega vozes clonadas diretamente nos seus apps, agentes e pipelines de dublagem. Veja preços para detalhes dos níveis.