Com uma amostra de apenas 15 segundos da voz, a nova IA, chamada de Voice Engine, é capaz de duplicar a fala dessa pessoa. Empresa diz que 'planeja manter a tecnologia sob estrito controle até que sejam implementadas medidas de segurança'. OpenAI
Reuters/Dado Ruvic/Illustration
A OpenAI, empresa por trás do ChatGPT, revelou uma ferramenta de clonagem de voz, chamada de Voice Engine, que pode duplicar a fala de alguém com base em uma amostra de apenas 15 segundos da voz da pessoa.
A ferramenta ainda não está disponível para todo mundo e a empresa planeja manter ela sob estrito controle até que sejam implementadas medidas de segurança para impedir falsificações de áudio destinadas a enganar os ouvintes.
"Reconhecemos que gerar fala que se assemelha às vozes das pessoas apresenta sérios riscos, que estão especialmente em destaque em um ano de eleições", disse a empresa em comunicado.
"Estamos envolvendo parceiros dos Estados Unidos, governos, mídia, empresas de entretenimento, educação, sociedade civil e outros setores para garantir que estamos incorporando seus feedbacks conforme construímos", acrescentou.
Pesquisadores de desinformação temem o uso generalizado de softwares alimentados por inteligência artificial (IA) em um ano eleitoral.
Admitindo esses problemas, a OpenAI afirmou que está "adotando uma abordagem cautelosa e informada para um lançamento mais amplo devido ao potencial de uso indevido de vozes sintéticas".
A OpenAI disse que seus parceiros que estão testando o Voice Engine concordaram com as regras, incluindo a necessidade de consentimento explícito e informado de qualquer pessoa cuja voz seja duplicada.
Também deve ficar claro para o público quando as vozes que estão ouvindo são geradas por IA, acrescentou a empresa.
"Implementamos um conjunto de medidas de segurança, incluindo marca d'água para rastrear a origem de qualquer áudio gerado pelo Voice Engine, bem como monitoramento proativo de como ele está sendo usado", garantiu a companhia.
Em fevereiro, a OpenAI também revelou um modelo de inteligência artificial que cria vídeos realistas a partir de texto curtos. Batizado de Sora, ele foi liberado para análises de especialistas e ainda não está disponível ao público.
"O Sora pode criar vídeos de até 60 segundos com cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes", explica a empresa.
Robô da criadora do ChatGPT que gera vídeos com IA a partir de textos comete gafes; veja exemplos
Conheça o Sora, gerador de vídeos realistas da dona do ChatGPT
Conheça o Sora, gerador de vídeos realistas da dona do ChatGPT
ChatGPT: como usar o robô no dia a dia
ChatGPT: como usar o robô no dia a dia