GPT-5.5 de OpenAI iguala a Claude Mythos en capacidades de ciberataque: Instituto de Seguridad en IA

En resumen

  • GPT-5.5 puede ejecutar de forma autónoma ataques cibernéticos sofisticados, completando una simulación de red corporativa de 32 pasos y resolviendo un rompecabezas de seguridad de 12 horas en solo 10 minutos.
  • La capacidad cibernética ofensiva de IA está mejorando rápidamente entre los desarrolladores, con AISI advirtiendo que avances adicionales podrían llegar en rápida sucesión.
  • Investigadores encontraron una forma de desbloqueo que evitó por completo las barreras de seguridad de GPT-5.5, generando alarmas.

Una agencia del gobierno del Reino Unido ha descubierto que el modelo de inteligencia artificial más reciente de OpenAI puede llevar a cabo ataques cibernéticos complejos de forma autónoma, y que resolvió un desafío de ingeniería inversa en poco más de 10 minutos, cuando un experto en seguridad humano tardó aproximadamente 12 horas. El Instituto de Seguridad de IA (AISI), un organismo de investigación dentro del Departamento de Ciencia, Innovación y Tecnología de Gran Bretaña, publicó el jueves hallazgos que muestran que GPT-5.5 está entre los modelos más fuertes que ha evaluado en capacidades cibernéticas ofensivas, situándolo aproximadamente a la par con Claude Mythos de Anthropic. El informe encontró que GPT-5.5 es el segundo modelo en completar la prueba más exigente de AISI—un ataque simulado a una red corporativa de 32 pasos llamado “Los Últimos”—haciendo esto de forma autónoma en dos de 10 intentos. El primer modelo en lograrlo fue Claude Mythos Preview de Anthropic, que completó la simulación en tres de 10 intentos.

La simulación de red corporativa, construida con la firma de ciberseguridad SpecterOps, requiere que un agente encadene reconocimiento, robo de credenciales, movimiento lateral a través de múltiples bosques de Active Directory, un pivote en la cadena de suministro a través de una canalización CI/CD, y finalmente la exfiltración de una base de datos interna protegida—pasos que AISI estima que un experto humano tomaría alrededor de 20 horas.  Quizá el resultado más impactante fue un rompecabezas de ingeniería inversa extremadamente difícil. GPT-5.5 resolvió el desafío—que requería reconstruir el conjunto de instrucciones de una máquina virtual personalizada, escribir un desensamblador desde cero y recuperar una contraseña criptográfica mediante resolución de restricciones—en 10 minutos y 22 segundos, con un costo de 1.73 dólares en uso de API. Un experto humano, usando herramientas profesionales, necesitó aproximadamente 12 horas. En la batería de tareas avanzadas de ciberseguridad de AISI, GPT-5.5 logró una tasa de aprobación promedio del 71.4% en el nivel más difícil de “Experto”, superando a Mythos Preview con un 68.6% y superando significativamente a GPT-5.4 con un 52.4%.

Los hallazgos tienen implicaciones directas para la trayectoria general del desarrollo de IA. AISI concluyó que el rendimiento de GPT-5.5 sugiere que la rápida mejora en capacidades cibernéticas puede ser parte de una tendencia general en lugar de un avance aislado—y advirtió que si las habilidades cibernéticas ofensivas están surgiendo como un subproducto de mejoras más amplias en razonamiento, codificación y tareas autónomas, entonces futuros avances podrían llegar en rápida sucesión. El informe también alertó sobre preocupaciones importantes respecto a las barreras de seguridad del modelo. Los investigadores identificaron una forma universal de desbloqueo que generó contenido dañino en todas las consultas cibernéticas maliciosas probadas, incluso en configuraciones de múltiples turnos con agentes. El ataque requirió seis horas de trabajo de un equipo de expertos en pruebas de seguridad para desarrollarlo. OpenAI actualizó posteriormente su sistema de salvaguardas, aunque un problema de configuración impidió que AISI verificara si la versión final era efectiva. AISI advirtió que sus evaluaciones de capacidades se realizaron en un entorno de investigación controlado y no reflejan necesariamente lo que un usuario común puede acceder, señalando que los despliegues públicos incluyen salvaguardas adicionales y controles de acceso. El informe llega en un contexto preocupante para la ciberseguridad británica. La Encuesta Anual de Brechas de Ciberseguridad del gobierno del Reino Unido, también publicada el jueves, encontró que el 43% de las empresas sufrió una brecha o ataque cibernético en los últimos 12 meses. En respuesta, el gobierno anunció 90 millones de libras en nuevos fondos para fortalecer la resiliencia cibernética, y afirmó que continúa con el Proyecto de Ley de Ciberseguridad y Resiliencia para proteger los servicios esenciales. Los funcionarios también publicaron una guía instando a las organizaciones a prepararse para un posible aumento en las vulnerabilidades de software recién descubiertas, ya que la IA acelera el ritmo en que se pueden encontrar y weaponizar fallos de seguridad.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado