Mensagem do Gate News, 16 de abril — A Google e a Boston Dynamics anunciaram uma integração de modelos embodied reasoning da Gemini Robotics no robô quadrúpede Spot, permitindo ao sistema interpretar instruções em linguagem natural, reconhecer objetos e executar tarefas complexas de forma autónoma.
A colaboração, alicerçada em trabalho experimental de um hackathon interno de 2025, permite que o Spot processe entradas visuais e traduza comandos de alto nível em ações físicas coordenadas. Ao contrário da programação tradicional em robótica, que depende de uma lógica rígida passo a passo, o sistema utiliza prompts conversacionais e uma camada intermédia de software que liga os modelos Gemini à API do Spot. A IA pode selecionar, a partir de capacidades predefinidas, incluindo navegação, deteção de objetos, captura de imagem, preensão e colocação, com feedback em tempo real que possibilita um comportamento adaptativo sem intervenção manual.
Em demonstrações, o sistema interpretou com sucesso instruções gerais para organizar itens, analisando dados visuais e encaminhando o robô através de sequências de ação. A abordagem mantém a segurança operacional ao restringir as capacidades da IA a limites predefinidos dentro da API do robô, equilibrando a adaptabilidade com um desempenho controlado. A parceria sugere potenciais ganhos de eficiência para os programadores ao reduzir a codificação manual e permitir que os engenheiros se foquem em definir objetivos em vez de programar cada sequência de ações.