OpenAI y Anthropic presentaron nuevos modelos de IA insignia en sus respectivas líneas de productos en una hora de diferencia el jueves, destacando la intensificación de la competencia entre los principales desarrolladores para dominar el software empresarial y las herramientas avanzadas de codificación. Anthropic anunció Claude Opus 4.6, destacando avances en razonamiento de contexto largo y flujos de trabajo basados en agentes, mientras que OpenAI poco después lanzó GPT-5.3 Codex, un modelo optimizado para codificación y desarrollo de software con enfoque en agentes. Los lanzamientos casi simultáneos subrayaron qué tan rápidamente los rivales están iterando mientras las empresas compiten por asegurar contratos a largo plazo con grandes clientes corporativos.

Los resultados de referencia sugirieron que los dos modelos están optimizados para diferentes fortalezas. Claude Opus 4.6 mostró un rendimiento más fuerte en tareas relacionadas con razonamiento legal y financiero, mientras que GPT-5.3 Codex superó en pruebas de codificación con enfoque en agentes y métricas de eficiencia, según cifras publicadas por ambas empresas. Los lanzamientos llegan en un momento en que los inversores reevaluan las perspectivas para los proveedores de software tradicionales, con acciones de varias empresas de información y servicios profesionales cayendo esta semana ante preocupaciones de que las plataformas nativas de IA puedan erosionar la demanda de herramientas empresariales establecidas. Anthropic dijo que Claude Opus 4.6 logró avances en razonamiento de contexto largo y tareas profesionales, citando una ventana de contexto de 1 millón de tokens y una puntuación del 76% en MRCR v2, un benchmark para recuperación de información compleja.

La compañía afirmó que el modelo también superó a versiones anteriores en tareas de finanzas y legales y presentó “equipos de agentes” que permiten que múltiples agentes de IA trabajen en paralelo en codificación y documentación. OpenAI lanzó GPT-5.3 Codex poco después, posicionándolo como un modelo optimizado para codificación y investigación con enfoque en agentes. OpenAI dijo que Codex obtuvo un 77.3% en Terminal-Bench 2.0, un benchmark de codificación con enfoque en agentes donde Claude Opus 4.6 obtuvo un 65.4%, y completó tareas más rápido usando menos tokens. OpenAI también afirmó que versiones tempranas de Codex se usaron internamente para ayudar a depurar el entrenamiento y gestionar el despliegue, marcando una de las primeras veces que un modelo jugó un papel directo en acelerar su propio desarrollo. En conjunto, los resultados sugieren que ninguno de los modelos tiene una ventaja clara en general, con ventajas de rendimiento que dependen de si las empresas priorizan el razonamiento profesional o el desarrollo autónomo de software. Se espera que Google también lance actualizaciones de sus modelos Gemini en los próximos meses, mientras que otros desarrolladores de IA, como DeepSeek, están preparando nuevos lanzamientos, aumentando el ritmo de competencia en el sector. Aún así, los resultados de referencia por sí solos probablemente no determinen el liderazgo en el mercado, ya que una adopción más amplia y el despliegue empresarial influyen cada vez más en el panorama competitivo. Mientras la competencia continúa presionando a los rivales, el tiempo dirá si los flujos de trabajo basados en agentes se convierten en un componente central de la actividad económica. OpenAI y Anthropic ciertamente están apostando a eso.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.

Comentar

0/400

Sin comentarios