Anthropic Despliega Mythos AI en la NSA mientras Pide una Pausa Global

Anthropic ha integrado aproximadamente a seis ingenieros en la Agencia de Seguridad Nacional para desplegar su modelo de IA Mythos en operaciones cibernéticas ofensivas, informó el Financial Times el jueves. Los ingenieros están personalizando el modelo para aplicaciones específicas, potencialmente incluyendo la infiltración de redes en China e Irán, según una fuente citada por el FT. El despliegue ocurrió mientras Anthropic publicaba simultáneamente investigaciones que piden un mecanismo coordinado de pausa global para el desarrollo de IA y presentaba una solicitud de IPO que podría valorar a la empresa por encima de 1 billón de dólares.

Anthropic despliega ingenieros en la NSA para operaciones con Mythos

Anthropic colocó a unos seis ingenieros dentro de la Agencia de Seguridad Nacional para ayudar a desplegar Mythos, su modelo de IA más capaz, para operaciones cibernéticas ofensivas, según el informe del Financial Times. Los ingenieros son personal desplegado hacia adelante que personaliza el modelo para aplicaciones específicas. Una fuente le dijo al FT que el modelo podría ser útil para infiltrarse en redes de países como China e Irán.

Mythos es el mismo modelo que Anthropic se ha negado a liberar públicamente, citando el riesgo de mal uso. La empresa lo limitó a socios verificados a través de Project Glasswing, una coalición restringida que incluye Microsoft, Apple y Amazon. No se confirma si los ingenieros están involucrados en operaciones activas.

Anthropic demanda al Pentágono por designación de riesgo en la cadena de suministro

Anthropic está demandando al Pentágono después de que el secretario de Defensa Pete Hegseth designara a la empresa como un riesgo en la cadena de suministro a finales de febrero; una etiqueta históricamente reservada para adversarios extranjeros como Huawei. La designación siguió al colapso de un contrato de 200 millones de dólares. El punto clave: Anthropic se negó a permitir que el Departamento de Defensa use Claude para armas totalmente autónomas o para vigilancia masiva interna. El contrato de la NSA fue exento de esa prohibición.

Un juez de California bloqueó la lista negra como una aparente represalia por la Primera Enmienda. Un tribunal de apelaciones del D.C. negó la petición de Anthropic de detener la designación mientras avanza el litigio. La NSA continuó usando Mythos durante este período, según el reporte del FT. El plazo del Pentágono para retirar a Claude de sus sistemas vence en agosto.

Claude escribe más del 80% del código de producción de Anthropic

El mismo día en que se dio a conocer la historia sobre la NSA, el instituto de investigación interno de Anthropic publicó “When AI Builds Itself”, examinando hasta qué punto Claude ha llegado automatizando su propio desarrollo. Claude ahora escribe más del 80% del código fusionado en la base de código de producción de Anthropic, frente a cifras de un solo dígito bajo antes de que Claude Code lanzara a principios de 2025. Los ingenieros envían aproximadamente ocho veces más código por día que en 2024.

En abril, a los agentes de Claude se les entregó un problema abierto de seguridad de IA—si un modelo más débil puede supervisar de forma fiable a uno más fuerte—y se les dejó ejecutarlo. Dos investigadores humanos recuperaron el 23% de la brecha de desempeño entre los modelos en aproximadamente una semana. Los agentes recuperaron el 97% durante 800 horas acumuladas de cómputo. Los humanos plantearon la pregunta mientras los agentes diseñaron cada experimento. Los autores del informe—líder del Anthropic Institute Marina Favaro y cofundador Jack Clark—lo describieron como el primer caso publicado de Claude ejerciendo juicio de investigación en lugar de solo ejecutar tareas especificadas por otra persona.

Anthropic propone una pausa global verificable para el desarrollo de IA

El informe defiende una pausa global verificable—múltiples laboratorios de frontera deteniéndose simultáneamente con verificación independiente de que todos realmente se detuvieron. Anthropic afirmó que se uniría a una pausa de este tipo. Los autores compararon el mecanismo propuesto con los tratados nucleares de la era de la Guerra Fría acordados entre Estados Unidos y Rusia.

Anthropic advirtió que la trayectoria se dirige hacia la mejora recursiva y auto-mejoramiento: sistemas de IA que diseñan, construyen y entrenan de forma autónoma a sus propios sucesores, con los humanos desempeñando un papel cada vez menor en cada etapa. Una vez que la IA elige qué experimentos vale la pena ejecutar—no solo ejecutarlos—los humanos pierden el último rol significativo en el ciclo de desarrollo, según el informe. Las pequeñas desalineaciones visibles en los modelos de hoy podrían acumularse a través de generaciones que se auto-mejoran hasta que nadie pueda corregirlas.

Advertencias de seguridad de IA emitidas en 2023 no frenaron el desarrollo

En 2023, más de cien figuras importantes en la comunidad de investigación de IA firmaron una carta abierta pidiendo un esfuerzo global para mitigar el riesgo de extinción que el desarrollo de IA intrínsecamente tiene. Unos meses antes de eso, otra carta abierta exigió que OpenAI pausara los avances de ChatGPT debido a su naturaleza peligrosa. Nadie se detuvo después de la carta abierta de 2023. OpenAI no lo hizo. Anthropic tampoco.

Preguntas frecuentes

¿Qué desplegó Anthropic en la NSA? Anthropic integró a aproximadamente seis ingenieros en la Agencia de Seguridad Nacional para desplegar su modelo de IA Mythos para operaciones cibernéticas ofensivas, según un informe del Financial Times publicado el jueves. Los ingenieros están personalizando el modelo para aplicaciones específicas, potencialmente incluyendo la infiltración de redes en China e Irán.

¿Por qué Anthropic está demandando al Pentágono? Anthropic está demandando al Pentágono después de que el secretario de Defensa Pete Hegseth designara a la empresa como un riesgo en la cadena de suministro a finales de febrero tras el colapso de un contrato de 200 millones de dólares. Anthropic se negó a permitir que el Departamento de Defensa use Claude para armas totalmente autónomas o para vigilancia masiva interna. Un juez de California bloqueó la lista negra como una aparente represalia por la Primera Enmienda, mientras que un tribunal de apelaciones del D.C. negó la petición de Anthropic de detener la designación durante el litigio.

¿Cuánto código escribe Claude para Anthropic? Claude ahora escribe más del 80% del código fusionado en la base de código de producción de Anthropic, frente a cifras de un solo dígito bajo antes de que Claude Code lanzara a principios de 2025. Los ingenieros envían aproximadamente ocho veces más código por día que en 2024, según el informe “When AI Builds Itself” de Anthropic, publicado por el instituto de investigación interno de la compañía.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios