3 anos a atingir 14 mil milhões de dólares! SoftBank, NVIDIA competem por investimento de centenas de bilhões de dólares na avaliação de "unicórnio"

軟銀、輝達搶投Skild AI

Em 2026, o círculo da IA dará origem aos 100 mil milhões de unicórnios mais rápidos. A Skild AI concluiu financiamento Série C com uma avaliação superior a 140 mil milhões de dólares, e foi investida pela SoftBank, Nvidia e Bezos em apenas 3 anos após a sua fundação. O fundador é da Meta AI, que não constrói hardware para robôs, mas foca-se em criar um “cérebro universal” chamado Skild Brain, que utiliza modelos partilhados para dar aos robôs a capacidade de aceder ao mundo físico.

A lógica do capital de um aumento de dez vezes na valorização em dois anos

A Skild AI é o unicórnio mais rápido a ultrapassar os 100 mil milhões este ano, com um ritmo de desenvolvimento acelerado e uma forte expansão de valoração, fenomenal mesmo na onda frenética de investimento em IA. Apenas dois meses após a sua fundação, a empresa recebeu uma ronda inicial de 14,5 milhões de dólares liderada pela Lightspeed Ventures, lançando com sucesso o seu lançamento. No seu primeiro aniversário, a Skild AI completou uma ronda de financiamento Série A de até 300 milhões de dólares, e a sua avaliação pós-investimento saltou para 15 mil milhões de dólares. Em menos de dois anos, a sua avaliação aumentou quase dez vezes, e o mais recente financiamento da Série C elevou a sua avaliação para 140 mil milhões de dólares.

A razão pela qual o capital aposta na Skild AI é simples – o mercado de trabalho global enfrenta uma lacuna severa. Espera-se que a disparidade de emprego só na indústria transformadora dos EUA atinja 2,1 milhões até 2030, e o problema do envelhecimento populacional em economias desenvolvidas como a Europa e o Japão é ainda mais grave. Robôs de uso geral, capazes de realizar tarefas complexas de física, são vistos como a chave para resolver a crise de produtividade. No entanto, a atual indústria da robótica está altamente fragmentada, e todos os fabricantes tentam desenvolver tudo, desde estruturas mecânicas a sistemas de controlo, resultando em elevados custos de I&D e na impossibilidade de migrar capacidades entre plataformas.

O modelo puramente software da Skild AI de “fazer apenas o cérebro, não o corpo” está em linha com a tendência geral da indústria de mudar de “orientado para hardware” para “modelos de IA e capacidades de software”. A Sequoia Capital escreveu no relatório pós-investimento: “O valor central da Skild AI é usar um modelo de fundação partilhada para desbloquear a ‘capacidade emergente’ dos robôs no mundo físico. Isto é fundamentalmente diferente da não escalabilidade do ‘controlador de ponto único’ no passado.” Esta “capacidade emergente” é semelhante à descoberta do GPT-3 na compreensão da linguagem, onde, quando o modelo atinge um ponto crítico, tem automaticamente capacidades que não foram explicitamente ensinadas durante o treino.

O envolvimento do SoftBank é particularmente estratégico. O gigante tecnológico japonês adquiriu a ARM em 2016 por 320 mil milhões de dólares e tem vindo a trabalhar no campo da robótica (como a aquisição da Boston Dynamics). O SoftBank Vision Fund é conhecido pela sua agressividade no investimento em IA, e esta posição pesada na Skild AI mostra que acredita que o “cérebro universal robótico” é o próximo mercado de biliões de dólares. A adição da Nvidia proporciona poder de computação e suporte ecológico, e a infraestrutura de treino da Skild AI deverá ser construída sobre o cluster de GPUs da Nvidia. O investimento pessoal de Bezos é ainda mais raro, pois o fundador da Amazon raramente participa em projetos em fase inicial, e o seu endosso traz um valor intangível de marca à Skild AI.

Os genes tecnológicos da equipa que saiu da Meta

A resposta às capacidades técnicas da Skild AI está escondida nos bastidores da equipa fundadora. Antes de fundar a Skild AI, Deepak Pathak foi um académico e praticante reconhecido na área da inteligência artificial e robótica, tendo sido professor assistente na Carnegie Mellon University e publicado vários artigos amplamente citados. Durante o seu tempo na Meta AI, esteve profundamente envolvido em vários projetos-chave sobre aprendizagem adaptativa, migração por simulação para o mundo real e treino de dados robóticos em grande escala.

Pathak acredita firmemente que a verdadeira inteligência geral da IA deve ser construída através da interação e da tentativa e erro no mundo físico, em vez de depender apenas de dados digitais de texto ou imagem. Este conceito foi questionado dentro da Meta, pois o foco da Meta estava no metaverso e na IA social na altura, e o seu investimento em robôs físicos era relativamente conservador. Este desacordo estratégico acabou por levar Pathak a escolher iniciar um negócio e dar vida à ideia.

Abhinav Gupta, também da Meta AI, alcançou conquistas na interseção entre visão computacional e aprendizagem em robótica. Enfatizou a aprendizagem de conhecimentos de física a partir de dados de vídeo à escala de rede, permitindo às máquinas compreender propriedades dos objetos, leis físicas e intenções humanas. Na verdade, Gupta e Pathak colaboraram várias vezes durante o seu tempo na Meta para explorar como replicar as “capacidades emergentes” de grandes modelos de linguagem em robôs físicos.

Ambos acreditam que a atual indústria da robótica depende demasiado de soluções personalizadas para tarefas específicas e hardware específico, e carece de um “cérebro universal” generalizável e escalável, o que limita seriamente o potencial de aplicação e a velocidade de popularização dos robôs no mundo real. Como resultado, os dois já começaram a incubar um projeto interno nas fases finais da Meta para tentar construir um modelo de fundação robótica que não dependa de hardware específico. Finalmente, no início de 2023, Pathak e Gupta decidiram deixar a Meta e começar um negócio a tempo inteiro. Acreditam firmemente que o futuro da indústria da robótica não passa por criar mais “corpos”, mas sim por fornecer um “cérebro” poderoso e partilhado.

O momento GPT-3 na indústria da robótica

Avançando para 2023, quando os robôs inteligentes proliferavam por todo o lado, mas cada robô precisava de treinar algoritmos especializados do zero, resultando em longos ciclos de I&D, custos elevados e capacidades incomunicáveis entre diferentes robôs. Na indústria da inteligência incorporada, sempre houve um problema que aflige a indústria: como generalizar? A chamada generalização refere-se à capacidade de um robô que pode ser rapidamente copiado para outros robôs.

Isto é muito difícil para os robôs porque o mundo físico é extremamente complexo, incerto e altamente dinâmico, e os robôs precisam de resolver problemas de generalização nos três níveis de perceção, tomada de decisão e execução ao mesmo tempo. Por exemplo, alterações de iluminação, efeitos meteorológicos, desordem de fundo, interferência de oclusão, etc., podem causar alterações drásticas na distribuição dos dados de entrada dos sensores visuais. Mesmo que cada tarefa simples (por exemplo, agarrar, andar) seja aprendida, quando combinada em tarefas complexas (por exemplo, “abrir o frigorífico, tirar uma bebida e deitá-la num copo”), o espaço para tomar decisões aumenta exponencialmente.

Skild Brain resolve os três principais caminhos técnicos da generalização

Pré-treino multimodal em grande escala: Aprender conhecimentos de física através de vídeos web, ambientes simulados e dados reais de robôs para criar representações comuns entre cenários

O hardware é independente da arquitetura: Desacoplar a perceção e a lógica de tomada de decisão de estruturas mecânicas específicas através de camadas de abstração, de modo que o mesmo modelo possa ser implementado em diferentes formas de robôs, como rodas, pés e braços

Mecanismo de aprendizagem contínua: Os dados gerados pelo robô durante a execução da tarefa são enviados de volta para a cloud, e o modelo é continuamente otimizado, e a experiência de cada robô pode beneficiar toda a rede

A Skild AI não fabrica hardware robótico, mas visa instalar um “cérebro universal” para todos os robôs, e os seus fundadores afirmam que estão a criar “momentos GPT-3” de inteligência incorporada. O Skild Brain separa software de hardware, evitando estar preso a um único design de hardware. Ao mesmo tempo, reduz o limiar da indústria o máximo possível, permitindo que outros fabricantes ou integradores de robôs se concentrem na otimização de hardware e implementação de cenários, e recorram diretamente à API da Skild Brain para obter inteligência avançada, acelerando significativamente a popularização de aplicações robóticas.

As perspetivas de comercialização também são promissoras. Nos setores industrial e comercial, os robôs numa linha de produção não precisam de ser desligados devido a uma pequena falha; No resgate em desastres, os robôs podem continuar a realizar tarefas mesmo que tenham “membros amputados”; No mercado de consumo, um “cérebro” pode ser usado “fora da concha” para reduzir significativamente os custos. Estas pedras tecnológicas estão a remodelar a compreensão das pessoas sobre a AGI – o conhecimento digital sozinho não pode construir uma IAG real, e os agentes de máquinas têm de aprender através de aprendizagem “prática” para compreender as leis operacionais reais no mundo físico.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)