Mensaje de Gate News, 27 de abril — Logan Kilpatrick, gerente de producto senior en Google DeepMind y responsable de producto de Google AI Studio, afirmó en X que cada empresa que construye productos basados en IA debe establecer sus propios puntos de referencia personalizados para medir el rendimiento de los modelos de IA. Lo describió como una forma para que las mejoras del modelo “beneficien de manera desproporcionada a tu empresa” y exhortó a los fundadores y líderes empresariales a “empezar mañana.”
La mayoría de las empresas actualmente dependen de rankings públicos para seleccionar modelos de IA, pero estos miden capacidades generales que a menudo no se alinean con escenarios empresariales específicos. Kilpatrick citó el ejemplo de una empresa de revisión de contratos que se centra principalmente en la precisión de la extracción de cláusulas, una capacidad ausente en los puntos de referencia públicos, lo que hace imposible evaluar el rendimiento del modelo en esa tarea. Los puntos de referencia personalizados ofrecen dos ventajas clave: primero, permiten a las empresas evaluar cada actualización de modelo frente a sus propias tareas de negocio y seleccionar el modelo que mejor se desempeña en su caso de uso real en lugar del modelo mejor clasificado en general; segundo, permiten a las empresas compartir estos conjuntos de prueba con los proveedores de modelos, impulsando la optimización continua en las áreas que importan para su negocio.
Kilpatrick señaló que empresas como Zapier y Sierra ya están implementando este enfoque, afirmando que “aquí se puede crear mucho alpha”.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
IEA: El gasto en infraestructura de IA ya ha superado la inversión en producción de petróleo y gas, y se prevé que aumente otro 75% en 2026
Según el análisis y los datos de mercado publicados por la Agencia Internacional de Energía (IEA) el 26 de abril, el gasto de capital total de las cinco principales empresas tecnológicas en 2025 supera los 400 mil millones de dólares, invertido principalmente en la construcción de infraestructura de IA, con un tamaño que ya ha superado la escala de inversión anual de la producción mundial de petróleo y gas natural. La IEA estima que el gasto de capital relacionado podría aumentar aún más en 75% en 2026.
MarketWhisperHace21m
El senador Bernie Sanders lanza una advertencia sobre la amenaza existencial de la IA
Sanders subrayó que incluso cuando la mayoría de los científicos de IA reconocen la posibilidad de que la IA escape al control y se convierta en un peligro para nuestra existencia, no se han tomado medidas importantes para evitarlo. “Debemos asegurarnos de que la IA beneficie a la humanidad, no nos perjudique”, afirmó.
Aspectos clave:
Bernie Sanders
CoinpediaHace31m
Responsable del gran modelo de Xiaomi: La competencia en IA está pasando a la era de los agentes; la autoevolución es un acontecimiento clave para la AGI
La responsable del equipo de modelos de Xiaomi, Luo Fuli, realizó una entrevista en profundidad el 24 de abril en la plataforma Bilibili (número de video: BV1iVoVBgERD). La duración de la entrevista fue de 3,5 horas, y fue su primera vez en presentar de forma sistemática sus puntos de vista técnicos públicamente como responsable técnico. Luo Fuli dijo que la competición de los grandes modelos ya ha pasado de la era de Chat a la era de los Agentes, y señaló que “la autoevolución” será el acontecimiento clave de la AGI en el próximo año.
MarketWhisperHace31m
xAI Grok Voice se hace cargo de la línea de atención al cliente de Starlink, 70% de las llamadas se resuelven automáticamente en el acto
Según el anuncio oficial publicado por xAI el 23 de abril, xAI lanzó el agente de IA de voz Grok Voice Think Fast 1.0 y ya lo implementó en la línea de atención al cliente de Starlink +1 (888) GO STARLINK. Según los datos de pruebas en campo divulgados en el anuncio, el 70% de las llamadas se resuelven automáticamente por IA, sin necesidad de intervención humana.
MarketWhisperHace43m
GPT-5.5 重回编码前沿,但 OpenAI 在输给 Opus 4.7 后更换了基准
Gate News 信息,4 月 27 日——半导体与 AI 分析公司 SemiAnalysis 发布了包含 GPT-5.5、Claude Opus 4.7 和 DeepSeek V4 的编码助手对比基准测试。关键发现:GPT-5.5 标志着 OpenAI 在六个月内首次重返编码模型的前沿,且 SemiAnalysis 工程师如今在 Codex 与 Claude Code 之间交替使用,此前他们几乎完全依赖 Claude。GPT-5.5 基于代号为“Spud”的新预训练方法,代表了 OpenAI 自 GPT-4.5 之后首次扩展预训练规模,其中
GateNewsHace47m
MediaTek consigue un gran pedido de Google del TPU de octava generación. ¡La fermentación de ASIC impulsa a tres acciones concepto que se verán beneficiadas!
Mediatek ya se ha incorporado a la cadena de suministro de chips de entrenamiento de la 8.ª generación de TPU de Google, encargándose del diseño de I/O Die, y además adopta el empaquetado TSMC N3P y CoWoS-S, lo que muestra que ha alcanzado un nivel de diseño de AI ASIC de gama alta. Se prevé que este año los ingresos por ASIC superen los 1000 millones de dólares, y que el volumen de envíos de TPU llegue a tener la posibilidad de alcanzar el millón de unidades para 2027; la cadena de suministro taiwanesa, como King Yuan Electronics, FineTek y Hong Jing, entre otras, también se beneficiará, y el mercado se irá enfocando gradualmente en el futuro de la colaboración por especialización y la integración heterogénea con chiplets.
ChainNewsAbmediahace2h