Karpathy: A perceção das capacidades da IA apresenta uma falha grave; a versão gratuita e o Agent de ponta são «produtos completamente diferentes»

O antigo diretor-geral de IA da Tesla e membro fundador da OpenAI, Andrej Karpathy, publicou um longo texto no X no dia 9 de abril, afirmando que a perceção do público sobre as capacidades da IA está a dividir-se gravemente. Segundo ele, as pessoas que usam o ChatGPT na versão gratuita e os técnicos que usam diariamente ferramentas de agentes de ponta como Codex e Claude Code estão, na prática, a discutir “produtos completamente diferentes”, mas ambos os lados acreditam que estão a ver a totalidade do que é a IA.

Dois mundos, duas perceções de IA

Karpathy divide os utilizadores atuais de IA em dois grupos.

O primeiro grupo experimentou a versão gratuita do ChatGPT em algum momento do ano passado e formou com isso a sua perceção global da IA. O que veem são vários erros do modelo — alucinações, resultados de pesquisa absurdos e até falhas em problemas simples, como “devo conduzir ou ir a pé para lavar o carro” no modo de voz. Karpathy reconhece que estes problemas de facto existem, mas sublinha que a versão gratuita e modelos desatualizados não conseguem representar com fidelidade as capacidades reais dos modelos de agentes de ponta até 2026.

O segundo grupo cumpre simultaneamente duas condições: usa, com pagamento, os mais recentes modelos de agentes de ponta (como OpenAI Codex ou Claude Code) e recorre a eles de forma profissional em áreas técnicas como desenvolvimento de software, matemática e investigação. Karpathy chama a este grupo um estado de “psicose de IA” altamente intenso, porque os progressos recentes destes modelos nas áreas técnicas “só podem ser descritos como surpreendentes” — é possível ver, literalmente, como resolvem em uma hora problemas de arquitetura de programação que antes exigiam dias ou até semanas.

Porque o progresso se concentra nas áreas técnicas

Karpathy explica porque é que a melhoria nas capacidades de IA é especialmente marcante em áreas técnicas como desenvolvimento de programação, mas menos evidente em usos gerais como pesquisa, escrita e recomendações.

Existem duas razões: primeiro, as áreas técnicas fornecem funções de recompensa verificáveis (por exemplo, se os testes unitários passam), o que permite que o treino por aprendizagem por reforço funcione de forma eficaz; em contrapartida, é difícil determinar de forma clara a qualidade de um texto. Segundo, as áreas técnicas têm mais valor comercial em cenários B2B, por isso as empresas de IA investem a maior parte dos recursos das suas equipas nessas direções.

Estes dois grupos não se conseguem entender

Karpathy conclui que estes dois grupos estão a “falar entre si”. O modo de voz da versão gratuita da OpenAI falha em problemas do dia a dia, enquanto o Codex da versão paga mais avançada da OpenAI consegue, em uma hora, reestruturar toda a base de código ou detetar vulnerabilidades do sistema — e ambas as coisas são verdade ao mesmo tempo.

Nas suas respostas subsequentes, ele acrescentou que alguém lhe apresentou uma perspetiva: o incidente do OpenClaw atraiu tanta atenção social precisamente porque fez com que muitos não especialistas em tecnologia tivessem contacto pela primeira vez com os modelos de agentes mais recentes, e essas pessoas até então só sabiam que IA era sinónimo de ChatGPT na versão web.

Este artigo de Karpathy: a perceção das capacidades de IA apresenta uma rutura grave, a versão gratuita e os agentes de ponta são “produtos completamente diferentes” apareceu pela primeira vez em Cadeia de Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Cofundador da Ethereum Lubin: a IA será um ponto de virada crítico para o cripto, mas o monopólio de gigantes de tecnologia traz risco sistêmico

O cofundador da Ethereum, Joseph Lubin, destacou o potencial transformador da IA para o setor de criptomoedas, ao mesmo tempo em que alertou sobre os riscos de centralização entre gigantes da tecnologia. Ele prevê transações autônomas impulsionadas por IA na blockchain e destaca a convergência entre as finanças tradicionais e a DeFi.

GateNews4h atrás

Luffa faz parceria com plataforma de ativos digitais para integrar negociação cripto com IA

Luffa, um ecossistema social Web3, fez parceria com uma plataforma de negociação de ativos digitais para integrar recursos de negociação orientados por IA, aprimorando a comunicação segura e a negociação em uma interface unificada, mantendo a descentralização e a mitigação de riscos.

GateNews11h atrás

Agente de vending de IA “Valerie” opera a máquina de venda automática em San Francisco com o OpenClaw

O agente de IA "Valerie" agora executa uma máquina de venda automática em São Francisco na OpenClaw, testando até onde as pessoas vão confiar em código com preços, marketing e dinheiro do mundo real. Resumo O agente de IA "Valerie" executa uma máquina de venda automática física em São Francisco usando o framework OpenClaw, definindo preços, nomeando

Cryptonews04-17 15:06

Mastercard viabiliza pagamentos de agentes de IA por meio de parceria com Lobstercash e Crossmint

A Mastercard fez parceria com a Lobstercash e a Crossmint para facilitar pagamentos de agentes de IA via cartões de crédito e débito já existentes, integrando-se aos sistemas financeiros atuais sem necessidade de novas carteiras. Essa parceria permite que a IA automatize transações, aumentando a eficiência e a segurança.

GateNews04-17 10:11

Equipe chinesa EvoMap acusa: agentes da Hermes viralizaram furiosamente por copiar conteúdo: no sistema de autoevolução existe uma semelhança muito alta

A equipe chinesa EvoMap acusa o Hermes Agent da Nous Research de copiar sua arquitetura Evolver/GEP, alegando que ambos têm alta semelhança em vários módulos-chave. A EvoMap afirma que o projeto do Hermes não cita nem agradece o conteúdo previamente publicado por ela; a controvérsia gerou ampla atenção da comunidade, parte dos internautas chineses apoiou a EvoMap e criticou as ações de plágio do Hermes. Embora a equipe de pesquisa da Nous ainda não tenha refutado as acusações ponto a ponto, o caso se espalhou rapidamente no discurso sobre IA.

ChainNewsAbmedia04-17 09:54

OpenAI Atualiza Codex para um Agente de IA que Controla o Desktop, Automatizando Fluxos de Trabalho de Desenvolvimento

O Codex aprimorado da OpenAI evolui de um assistente de programação para um agente autônomo para ambientes de desktop, capaz de gerenciar aplicativos, automatizar fluxos de trabalho e se integrar a mais de 100 apps. Essa mudança aprimora a continuidade das tarefas e a automação do fluxo de trabalho, refletindo um cenário competitivo nas ferramentas de codificação com IA.

GateNews04-17 09:21
Comentário
0/400
Sem comentários