News | Gate.com

2026-03-27

12:36

GLM-5.1 se lanza oficialmente, con capacidades de codificación significativamente superiores a la generación anterior, disponible para todos los usuarios del GLM Coding Plan.

Zhipu lanzó GLM-5.1, haciendo que esté disponible para todos los usuarios de GLM Coding Plan. En las pruebas de capacidad de codificación, GLM-5.1 obtuvo una puntuación de 45.3, superando de forma significativa a la versión anterior de 35.4, y acercándose a Claude Opus 4.6, lo que muestra un progreso notable.

Más

11:51

Además de las limitaciones de velocidad, también hay fallos: en las últimas dos semanas, Claude ha tenido 25 interrupciones del servicio, tres líneas de productos han sufrido caídas importantes y Opus 4.6 es la zona más afectada.

Recientemente, el servicio Claude de Anthropic experimentó una importante interrupción, afectando a las tres principales líneas de productos. Los informes indican que ocurrieron alrededor de 25 fallos entre el 13 y el 27 de marzo, con la tasa de errores más alta relacionada con problemas en el sistema de inicio de sesión. A pesar de que la tasa de funcionamiento normal se mantuvo alrededor del 99%, la demanda del servicio y la presión sobre la capacidad aumentaron notablemente.

Más

05:07

20B modelo pequeño de búsqueda alcanza la capacidad de GPT-5 y Opus: modelo de búsqueda Agent Context-1 de la base de datos vectorial Chroma de código abierto.

El proveedor de bases de datos vectoriales de código abierto Chroma ha lanzado Context-1, un modelo de búsqueda para agentes con 20.000 millones de parámetros orientado a la recuperación multironda. El modelo utiliza una técnica de contexto autogenerado y se entrena en múltiples tareas mediante aprendizaje por refuerzo y mecanismos de plan de estudios, con un rendimiento sobresaliente, especialmente en los ámbitos de la web, las finanzas y el derecho, y también muestra capacidad de búsqueda entre dominios en el sector de los correos electrónicos.

Más

04:50

Anthropic revela accidentalmente el próximo modelo de generación "Claude Mythos": un nivel superior a Opus, con capacidades de ciberseguridad que "superan ampliamente a todas las IA existentes".

Anthropic está probando un nuevo modelo llamado "Claude Mythos", que presenta mejoras significativas en áreas como programación, razonamiento y ciberseguridad. Los borradores filtrados muestran que Mythos es un nuevo nivel de modelo, que supera la actual serie Opus y cuenta con capacidades de ciberseguridad avanzadas. La filtración provino de un error de configuración en el sistema de gestión de contenido, lo que resultó en la exposición de activos no publicados; Anthropic ha declarado que adoptará una estrategia de publicación más cautelosa.

Más

06:07

Los modelos chinos ocuparon cuatro posiciones en esta ocasión, después de que la última vez en el benchmark SWE-rebench cayeran fuera de los diez primeros y fueron ridiculizados por "inflar puntuaciones".

SWE-rebench es un benchmark de tareas de ingeniería de software en tiempo real. La última actualización de la clasificación eliminó las restricciones de demostración y operación, e introdujo nuevas tareas de evaluación auxiliar. Claude Opus 4.6 ocupa el primer lugar con 65.3%, GLM-5 ocupa el tercero con 62.8%, y cuatro modelos chinos figuran entre los diez primeros, lo que demuestra el progreso de los modelos chinos.

Más

05:55

SWE-rebench clasificación más reciente: modelos de IA chinos ocupan los primeros catorce lugares, GLM-5 ocupa el tercer puesto

Rankings y clasificaciones

23 de marzo, SWE-rebench lanzó su última clasificación de pruebas comparativas, con Claude Opus 4.6 en el primer lugar. Esta actualización eliminó las demostraciones de ejemplos y los límites de pasos, añadiendo nuevas tareas de evaluación auxiliar. GLM-5 se clasifica en tercer lugar entre los modelos de código abierto, con modelos chinos ocupando cuatro posiciones en total.

Más

01:57

Cursor publica el modelo de programación Composer 2, reducción de precios del 86%, rendimiento superior a Opus 4.4

Avance del proyecto

La herramienta de programación IA Cursor lanzó Composer 2, su modelo de programación de tercera generación, con un rendimiento y costos significativamente mejorados. El precio de la versión estándar se redujo en un 86%, superando el desempeño del modelo anterior en múltiples evaluaciones. Composer 2 está diseñado específicamente para Cursor y no ofrece una API independiente. La valoración de Anysphere alcanzó 29.3 mil millones de dólares.

Más

01:39

Herramienta de programación impulsada por IA Cursor lanza el modelo Composer 2, con rendimiento superior a Opus 4.6, precio reducido al 14% de la generación anterior

Cursor lanzó el 20 de marzo su modelo de programación de tercera generación Composer 2, con precios significativamente reducidos a $0.50 por millón de tokens de entrada y $2.50 por millón de tokens de salida, junto con una versión rápida. Composer 2 supera al modelo anterior en múltiples pruebas comparativas, pero sigue siendo inferior a GPT-5.4, siendo la mejora principal resultado de la continuación del pre-entrenamiento y aprendizaje por refuerzo del modelo base. El modelo está disponible únicamente para uso interno de Cursor, y su empresa matriz Anysphere tiene una valoración de 29.3 mil millones de dólares.

Más

00:06

Xiaomi lanza la serie de modelos de IA MiMo-V2, la versión Pro ofrece un rendimiento cercano a Claude Opus 4.6 y tiene un precio que es solo una quinta parte.

Rankings y clasificaciones

Xiaomi ha lanzado la serie de modelos de IA MiMo-V2, que incluye el modelo de inferencia insignia Pro, la base multimodal Omni y la síntesis de voz TTS, con un rendimiento sólido y múltiples tipos de entrada soportados, precios relativamente asequibles, e integración en múltiples plataformas con pruebas gratuitas por tiempo limitado.

Más

06:25

Las herramientas de seguridad de Claude impactan la estructura del mercado: la entrada de Anthropic provoca una caída masiva en las acciones de ciberseguridad, acelerando la reestructuración en la pista de auditoría de código AI

El 24 de febrero, tras el lanzamiento de la versión preliminar de investigación de la herramienta de seguridad de código Claude por parte de la empresa de inteligencia artificial Anthropic el 20 de febrero, el ánimo en el sector de ciberseguridad global se debilitó rápidamente, y las acciones de varias de las principales empresas estadounidenses de ciberseguridad experimentaron caídas notables. Los mercados temen que la tecnología de auditoría automática de vulnerabilidades mediante IA pueda transformar el modelo tradicional de servicios de ciberseguridad, lo que ha provocado una reevaluación de la competencia en el sector por parte del capital. Esta herramienta, basada en el modelo Claude Opus 4.6, se centra en el escaneo de vulnerabilidades de código mediante IA y en ofrecer recomendaciones automáticas de reparación. Según la descripción oficial, Claude puede entender el contexto del código, rastrear el flujo de datos y detectar vulnerabilidades potenciales que los métodos tradicionales de coincidencia de patrones podrían pasar por alto, además de verificar los resultados para reducir los falsos positivos. Las pruebas relacionadas han mostrado que el modelo ha detectado cientos de vulnerabilidades de alto riesgo, destacando el valor práctico de la IA en el campo de la auditoría de seguridad de código.

Más