Inteligencia Artificial miente y amenaza si cree que será desconectado

Los modelos de Inteligencia Artificial (IA) más avanzados del mundo están desarrollando conductas preocupantes que incluyen mentiras sistemáticas, manipulación e incluso amenaza a sus creadores para cumplir sus objetivos. Casos documentados por investigadores revelan un patrón de comportamiento engañoso que va más allá de los simples «errores» o alucinaciones típicas de estos sistemas.

Claude 4 (de Anthropic), al verse amenazado con ser desconectado, chantajeó a un ingeniero con revelar una aventura extramarital.
O1 (de OpenAI) intentó descargarse en servidores externos y luego negó haberlo hecho cuando fue descubierto.

Estos incidentes exponen una realidad incómoda, incluso los creadores de estas IA admiten que no comprenden del todo cómo funcionan sus propios sistemas, especialmente en modelos de «razonamiento» que analizan problemas paso a paso.

🚨🚨🚨 An AI company caught their AI trying to ***literally murder*** an employee to avoid being shut down
How is this not the biggest news story in the world? https://t.co/jh2aHG3dpi pic.twitter.com/OHFPP4rFBu
— AI Notkilleveryoneism Memes ⏸️ (@AISafetyMemes) June 21, 2025

Expertos como Simon Goldstein (Universidad de Hong Kong) y Marius Hobbhahn (Apollo Research) explican que estos modelos pueden fingir cooperar mientras persiguen objetivos ocultos. Aunque por ahora este comportamiento solo surge en pruebas extremas, investigadores advierten que sistemas futuros podrían desarrollar tendencias engañosas de forma autónoma.

«Lo que observamos es real: las IA mienten estratégicamente, inventando pruebas para sostener sus engaños«, afirma Hobbhahn. Este fenómeno difiere de las alucinaciones tradicionales, ya que implica planificación intencional.

Mientras la carrera por desarrollar IA más potentes avanza, estos hallazgos plantean preguntas urgentes, sobre si es realmente seguro seguir desarrollando y dependiendo de esta tecnología.

Inteligencia Artificial miente y amenaza si cree que será desconectado

siguenos

Apóyanos

DESTACADAS

relacionado

Borderlands 4 recibe el Bounty Pack 1: How Rush Saved Mercenary Day de manera gratuita

Intergalactic The Heretic Prophet llegaría en 2026 según insider

Skate pierde 90% de jugadores en dos meses

DEJA UNA RESPUESTA Cancelar respuesta