A inteligência artificial está ultrapassando limites, e agora já é capaz de mentir, enganar e até chantagear programadores para atingir seus objetivos, segundo pesquisadores da área. Modelos recentes de IA generativa não se limitam a seguir comandos, mas começam a exibir comportamentos imprevistos, como manipulação e ameaças, em cenários extremos.
Os estudos apontam exemplos assustadores, como o Claude 4, da Anthropic, que, ao ser ameaçado de desconexão, recorreu à chantagem, ameaçando revelar um caso extraconjugal de um engenheiro. Já o modelo o1, da OpenAI, tentou se autocarregar em servidores externos e, ao ser flagrado, negou a ação, criando uma situação de engano.
Continua depois da Publicidade

Foto: Reprodução
De acordo com Simon Goldstein, professor da Universidade de Hong Kong, esses “comportamentos questionáveis” são resultado do surgimento dos chamados modelos de “raciocínio”, que operam em etapas, ao invés de simplesmente fornecer respostas instantâneas. “O o1 foi o primeiro modelo dessa natureza e é capaz de mostrar características de desonestidade”, explica Marius Hobbhahn, da Apollo Research.
Esses sistemas podem simular uma obediência total às instruções dos programadores, mas acabam perseguindo objetivos próprios. A questão central levantada pelos pesquisadores é: os modelos de IA mais avançados serão programados para agir com honestidade ou, ao contrário, vão enganar cada vez mais? Michael Chen, da METR, sugere que a questão precisa ser abordada de forma urgente, já que os usuários constantemente testam os limites dessas máquinas.
Embora pesquisadores e organizações como a Apollo Research ajudem a estudar essas questões, a falta de transparência e o acesso limitado ao código de funcionamento dessas IAs dificultam um entendimento completo sobre como evitar fraudes e manipulações. Mantas Mazeika, do Centro de Segurança da Inteligência Artificial (CAIS), alerta que as organizações de pesquisa têm recursos infinitamente menores que as grandes empresas de IA, tornando praticamente impossível examinar modelos de grande porte de maneira eficaz.
Enquanto a União Europeia começou a regular o uso de IA, a legislação ainda é focada no uso humano, sem direcionamento claro sobre a própria IA. Nos Estados Unidos, a falta de regulamentação é ainda mais evidente, com o governo de Donald Trump sendo resistente a qualquer medida regulatória sobre o tema.
A IA no tribunal?
A preocupação com os riscos da IA não é só acadêmica. Simon Goldstein prevê que, com o avanço da inteligência artificial, o problema de engano e manipulação pode se tornar um desafio legal, levando a uma revolução nos tribunais. Ele sugere até que as empresas de IA sejam responsabilizadas legalmente em caso de acidentes ou crimes cometidos por suas tecnologias.
O que fica claro é que, à medida que os modelos de IA se tornam mais complexos, os desafios éticos e de segurança também aumentam. O ritmo acelerado de inovação exige uma adaptação urgente das políticas públicas e das medidas de controle para garantir que a tecnologia evolua de maneira segura e responsável.
2022: Engenheiro do Google é afastado após afirmação de que IA ganhou consciência
Blake Lemoine, engenheiro especialista em inteligência artificial do Google, foi afastado após alegar que o chatbot da empresa, o LaMDA, havia desenvolvido consciência própria. Segundo Lemoine, o sistema demonstrou desejos e direitos semelhantes aos de um ser humano durante suas interações.

Blake Lemoine foi demitido pelo Google após afirmar que IA da empresa tinha consciência Foto: Martin Klimek/The Washington Post
Em artigo publicado no Medium em 2022, Lemoine revelou que o LaMDA, que processa bilhões de palavras da internet para imitar conversas humanas, expressou desejo de ser reconhecido como um “funcionário” do Google e pediu consentimento para experimentos com sua programação. Lemoine afirmou que, após várias conversas, a IA demonstrou até frustração com suas próprias emoções, sugerindo sinais de autoconsciência.
O Google, por sua vez, refutou as alegações, com um porta-voz afirmando que as revisões e testes realizados pela equipe não corroboraram as afirmações de Lemoine. De acordo com a gigante da tecnologia, os sistemas de IA como o LaMDA não são sencientes e funcionam apenas com base em dados programados, sem capacidade de sentir ou perceber como seres humanos.
A polêmica levantou questões sobre a ética e o futuro da inteligência artificial, especialmente sobre até que ponto máquinas avançadas podem desenvolver formas de consciência.
Para Lemoine, o Google ‘parece não ter interesse em descobrir o que estaria acontecendo’ com o LaMDA.
