Mensagem do Gate News, 23 de abril — A equipa de investigação da Perplexity publicou um artigo técnico que detalha a sua metodologia de pós-treinamento para agentes de pesquisa na web. A abordagem utiliza dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e recorre a um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer obediência a instruções e consistência linguística, seguido de aprendizagem por reforço online (RL) para otimizar a precisão da pesquisa e a eficiência no uso de ferramentas.
A fase de RL utiliza o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de queries iniciais internas que exigem 2–4 hops de raciocínio com verificação por múltiplos solucionadores, e dados conversacionais gerais baseados em rubricas que convertem requisitos de implementação em condições atómicas objetivamente verificáveis para evitar a degradação do comportamento do SFT.
O desenho de recompensas emprega agregação com gating — as pontuações de preferência só contribuem quando a correcção de base é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica são satisfeitos), impedindo que sinais de preferência elevados mascarem erros factuais. As penalizações de eficiência utilizam ancoragem dentro do grupo, aplicando penalizações suaves às chamadas de ferramentas e ao comprimento da geração que excede a base de respostas correctas no mesmo grupo.
A avaliação mostra que o Qwen3.5-397B-SFT-RL atinge o melhor desempenho de referência em benchmarks de pesquisa. No FRAMES, alcança 57,3% de precisão com uma única chamada de ferramenta, superando o GPT-5.4 em 5,7 pontos percentuais e o Claude Sonnet 4.6 em 4,7 pontos percentuais. Sob um orçamento moderado (quatro chamadas de ferramentas), atinge 73,9% de precisão a $0,02 por consulta, em comparação com 67,8% de precisão do GPT-5.4 a $0,085 por consulta e 62,4% de precisão do Sonnet 4.6 a $0,153 por consulta. Os valores de custo baseiam-se na tarifação pública por API de cada fornecedor e excluem optimizações de caching.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
CEO da Google: investimento de 185 mil milhões em capital para 2026; reforço dos investimentos na era dos agentes de IA
O CEO da Google, Sundar Pichai, anunciou a 22 de abril, na conferência Google Cloud Next realizada em Las Vegas, que a Google planeia investir entre 175 mil milhões e 185 mil milhões de dólares em despesas de capital em 2026, para construir a infraestrutura necessária para agentes de inteligência artificial autónomos (AI Agent), o que representa um aumento face aos 31 mil milhões de dólares em 2022.
MarketWhisper1m atrás
A Google revela a lista de candidatos ao novo lançamento da Jules e reposiciona-a como uma plataforma de desenvolvimento de produtos ponta-a-ponta
De acordo com o anúncio oficial da equipa Google Jules em 23 de abril, a orientação do produto da Jules evoluiu de um agente de codificação assíncrona para uma «plataforma de desenvolvimento de produtos agentic ponta a ponta». A nova versão consegue ler o contexto completo do produto, decidir de forma autónoma o próximo rumo de construção e submeter PR. Em paralelo, a equipa oficial anunciou a abertura de uma lista de candidatos para a nova versão.
MarketWhisper7m atrás
Google Jules Reposiciona-se como Plataforma de Desenvolvimento de Produtos Orientada por Agentes, de Ponta a Ponta, e Abre Lista de Espera para Nova Versão
Mensagem do Gate News, 23 de abril — A equipa da Jules, da Google, anunciou a abertura de uma lista de espera para uma nova versão do produto, reposicionando a Jules de um agente de codificação assíncrona para uma plataforma de desenvolvimento de produtos orientada por agentes, de ponta a ponta. Segundo a descrição oficial, a plataforma atualizada lê enti
GateNews52m atrás
A Equipa de Codex da OpenAI Corrige um Bug de Autenticação do OpenClaw, Melhorando Significativamente o Comportamento do Agente
O OpenClaw muda de harness de Pi para o harness de Codex para corrigir uma falha silenciosa de autenticação, com dois PRs a abordar a ponte e o fallback; após a correção, o agente passa de uma sondagem superficial por heartbeat para um ciclo completo de trabalho, permitindo progresso.
Resumo: A otimização do harness de Codex do OpenClaw abordou uma falha crítica de autenticação que causava o fallback silencioso para o harness de Pi quando se usava Codex com modelos OpenAI. Dois pedidos pull corrigem a ponte de autenticação e evitam o fallback silencioso, alterando o adaptador em tempo de execução. Como resultado, o comportamento do agente evolui de uma sondagem superficial por heartbeat para um ciclo completo de trabalho que lê contexto, analisa tarefas, edita repositórios e verifica o progresso, melhorando a continuidade e a visibilidade entre heartbeats.
GateNews2h atrás
Agentes do OpenAI para o Workspace do ChatGPT: alimentados por Codex, partilha em equipa, integração com o Slack
A OpenAI lançou, a 22 de abril, os Workspace Agents no ChatGPT Business/Enterprise/Edu/Teachers, alimentados pelo Codex, com funcionamento em nuvem de longa duração, partilha entre equipas e execução offline. Podem responder proactivamente no Slack e lidar com faturação, executar fluxos de trabalho multi-etapa e suportar agendamento. A pré-visualização de investigação é gratuita até 6 de maio; depois, será aplicada uma cobrança baseada em créditos, com o preço a ser anunciado. Concorrendo em simultâneo com o GoogleGeminiEnterpriseAgentPlatform e o AnthropicClaudeCowork, as três soluções focam-se em agentes ao nível empresarial, mas a sua orientação é diferente em cada caso.
ChainNewsAbmedia3h atrás
Google Cloud Next 2026: lança a plataforma de agentes empresariais Gemini, 750 milhões de dólares para ajudar os consultores a implementarem
A Google Cloud anunciou, no Cloud Next 2026, a Gemini Enterprise Agent Platform, integrando a selecção de modelos, a construção de agentes, DevOps, orquestração e controlos de segurança para empresas, além de disponibilizar um fundo de 750 milhões de dólares para ajudar a McKinsey, Accenture e Deloitte a implementar agentes empresariais. A plataforma, em conjunto com o Ironwood TPU, A2A e MCP, cria um conjunto completo próprio e canais de consultoria, para fazer face ao OpenAI Operator e à versão empresarial do Anthropic Claude.
ChainNewsAbmedia3h atrás