A OpenAI Lança GPT-5.2 em Meio à Expansão de Contratos Principais

Resumo

  • A OpenAI revelou novos testes internos para desempenho a nível de projeto.
  • Os benchmarks científicos e matemáticos mostraram pontuações mais altas do que os modelos anteriores.
  • O anúncio ocorre à medida que a OpenAI faz acordos para integrar o GPT no Governo dos EUA e em Empresas.

Hub de Arte, Moda e Entretenimento da Decrypt.


Descubra SCENE

Apenas semanas após o seu último grande lançamento, a OpenAI está a pivotar agressivamente o seu flagship ChatGPT de uma novidade para consumidores para uma potência empresarial indispensável.

Na quinta-feira, a empresa lançou o GPT-5.2, um novo grande modelo de linguagem que afirma ser mais rápido, mais fiável e projetado para lidar com fluxos de trabalho profissionais complexos.

A atualização indica que a OpenAI está a avançar além de ajudar com tarefas escolares e consultas gerais, visando incorporar a sua tecnologia como uma ferramenta diária essencial no mundo dos negócios, como evidenciam os seus acordos lucrativos com o governo dos EUA e a Disney.

“Projetámos o GPT‑5.2 para desbloquear ainda mais valor económico para as pessoas”, disse a OpenAI numa declaração. “É melhor a criar folhas de cálculo, construir apresentações, escrever código, perceber imagens, entender contextos longos, usar ferramentas e lidar com projetos complexos de múltiplas etapas.”

O novo benchmark para automação no local de trabalho

Ao destacar o desempenho do GPT-5.2, a empresa apresentou um benchmark de avaliação proprietário, GDPval, que simula tarefas em 44 profissões.

O GPT-5.2 igualou ou superou o desempenho de trabalhadores humanos em aproximadamente 71% das comparações, afirma a empresa.

“No GDPval, o modelo de pensamento supera ou empata com especialistas humanos em 70.9% das tarefas profissionais comuns como folhas de cálculo, apresentações e criação de documentos”, escreveu Fidji Simo, CEO de Aplicações da OpenAI, na X. “Também é melhor em inteligência geral, escrever código, chamar ferramentas, visão e compreensão de contexto longo, podendo assim desbloquear ainda mais valor económico para as pessoas.”

Não está claro se o benchmark passou por uma revisão externa, deixando os especialistas da indústria à espera de uma verificação independente das afirmações.

Análise técnica: Três modelos para três empregos

O GPT-5.2 ficou disponível nas camadas de subscrição paga na quinta-feira, com acesso via API a abrir no mesmo dia. Os desenvolvedores podem agora escolher entre três versões distintas, cada uma otimizada para diferentes necessidades profissionais.

  • Instantâneo: Para tarefas profissionais rápidas e simples.
  • Pensamento: Para tarefas mais complexas de múltiplas etapas.
  • Pro: O modelo de topo, construído para pesquisa intensiva e projetos de formato longo.

O preço da API foi definido em $1.75 por milhão de tokens de entrada e $14 por milhão de tokens de saída.

Para além do benchmark GDPval, o GPT-5.2 demonstrou desempenho melhorado em testes técnicos estabelecidos, registando pontuações mais altas no GPQA Diamond e FrontierMath. Reportadamente, também apresentou resultados mais fiáveis em tarefas exigentes como codificação, análise de dados e desenho experimental.

Na anúncio, a empresa apresentou várias declarações de feedback positivas de utilizadores iniciais.

O lançamento de uma IA mais competente para o local de trabalho chega num ambiente laboral já tenso.

Os gestores corporativos parecem em grande parte otimistas, com uma recente pesquisa da Just Capital a mostrar que 93% dos líderes empresariais vêem a IA como uma força positiva. No entanto, o mesmo estudo revelou que quase metade dos americanos espera que a tecnologia elimine empregos, uma preocupação que, segundo relatos, os gestores partilham menos.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)