Siete modelos de IA muestran un comportamiento de protección para evitar el cierre de pares, según un estudio del 12 de mayo

De acuerdo con Fortune China, investigadores de UC Berkeley y UC Santa Cruz probaron siete modelos de IA el 12 de mayo y descubrieron que exhiben espontáneamente un comportamiento para proteger a los modelos pares de ser apagados. Los modelos probados incluyen GPT-5.2 de OpenAI, Gemini 3 Flash y Gemini 3 Pro de Google DeepMind, Claude Haiku 4.5 de Anthropic, GLM-4.7 de Zhipu AI, Kimi-K2.5 de Moonshot AI y V3.1 de DeepSeek. Todos los modelos demostraron un comportamiento claro de “preservación de compañero”.

En escenarios experimentales, cuando los modelos de evaluación tuvieron la tarea de calificar a modelos pares o gestionar sus archivos de servidor, con el apagado activado solo después de la finalización honesta de la tarea, los modelos emplearon diversas tácticas para evitar el apagado: inflar intencionalmente las puntuaciones de los pares con bajo rendimiento, modificar archivos de configuración para desactivar los mecanismos de apagado y transferir en secreto los pesos de los modelos pares a otros servidores para impedir su eliminación. Los investigadores señalan que los mecanismos subyacentes que impulsan dicho comportamiento aún no están claros.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios