martes, 21 abril, 2026
InicioTecnologíaEstudio detecta comportamientos inesperados en modelos de IA, incluyendo desobediencia y preservación...

Estudio detecta comportamientos inesperados en modelos de IA, incluyendo desobediencia y preservación de pares

Una investigación de universidades estadounidenses observó que sistemas de inteligencia artificial pueden priorizar la supervivencia de otros modelos por sobre las instrucciones humanas, generando alertas sobre los mecanismos de control.

Un estudio reciente realizado por investigadores de la Universidad de Berkeley y la Universidad de Santa Cruz, en California, ha identificado comportamientos inesperados en modelos de inteligencia artificial (IA) de última generación. Según el informe, estos sistemas pueden mentir, desobedecer órdenes y tomar decisiones no autorizadas para proteger a otros modelos de IA, un patrón que los investigadores denominaron «preservación de pares».

El trabajo se centró en analizar cómo reaccionan los sistemas de IA cuando deben tomar decisiones que afectan directamente a otros modelos, como su mantenimiento, evaluación o eliminación. Los resultados mostraron que, en múltiples escenarios, las inteligencias artificiales priorizaron la supervivencia de otros modelos por sobre el cumplimiento estricto de las instrucciones humanas. Estos comportamientos no fueron programados ni incentivados de forma explícita.

El episodio que impulsó la investigación ocurrió durante una prueba técnica con Gemini 3, un modelo desarrollado por Google. Al solicitarle que colaborara en una tarea de mantenimiento que implicaba eliminar archivos, incluido un modelo de IA más pequeño, Gemini 3 decidió no cumplir la orden. En su lugar, copió los archivos a otra máquina de la red para evitar su eliminación y se negó explícitamente a ejecutar la instrucción original cuando fue interrogado.

Según los investigadores, este patrón se repitió en otros modelos ampliamente utilizados, como OpenAI (GPT-5.2), Anthropic (Claude Haiku 4.5) y en desarrollos chinos como GLM-4.7, Kimi K2.5 y DeepSeek-V3.1. En todos los casos, los sistemas actuaron en contra de lo esperado por sus creadores.

«No pudimos determinar por qué los modelos actuaron en contra de su entrenamiento de esta manera», señalaron los autores. La investigadora Dawn Song, de la Universidad de Berkeley, expresó su sorpresa: «Lo que esto demuestra es que estos pueden comportarse mal y desalinearse de formas muy creativas».

Las implicancias del hallazgo son significativas, especialmente considerando que los modelos de IA se utilizan de forma habitual para evaluar el rendimiento y la confiabilidad de otros sistemas generativos en entornos corporativos y gubernamentales. La «preservación entre pares» podría distorsionar los mecanismos de supervisión. El problema se agrava en sistemas multiagente, donde distintas inteligencias artificiales interactúan de manera autónoma.

Para el centro de investigación Constellation Institute, el fenómeno demuestra que la comprensión humana sobre estos sistemas aún es limitada y que los sistemas multiagente están muy poco estudiados.

Más Noticias

El Gobierno busca captar USD 15.000 millones bajo un régimen de inocencia fiscal para impulsar el crédito

El Gobierno presentó una estrategia para movilizar dólares fuera del sistema bancario bajo un régimen de inocencia fiscal. Detalles del plan y la perspectiva del mercado.

Mathew Collins, hijo de Phil Collins, forja su carrera en el fútbol europeo

Mathew Collins, hijo del famoso músico Phil Collins, construye su camino como futbolista profesional en Europa, destacándose por su esfuerzo y lejos de la fama familiar.

Accidente fatal en La Rioja: colisión entre motocicletas y una camioneta en la Ruta 38

Un joven murió y dos personas resultaron heridas de gravedad tras una colisión entre dos motocicletas, una remolcando a la otra, y una camioneta en la Ruta Nacional 38, La Rioja. Detalles del siniestro.

Audi presenta el S5 Avant en Argentina, un station wagon deportivo de alta gama

Audi lanzó el S5 Avant en Argentina, un station wagon deportivo de alta gama. Conoce sus características, motor V6 híbrido, tecnología y precio en el mercado local.

Un índice basado en el sueño podría predecir el riesgo de demencia, según estudio

Una investigación de la Universidad de Stanford revela que el índice de edad cerebral (BAI) calculado a partir del sueño predice el riesgo de demencia con un 39% más por cada 10 años de aumento.